НовостиОбзорыВсе о нейросетяхБытовая техника 2024ГаджетыТехнологииНаукаСоцсетиЛайфхакиFunПромокодыСтранные вопросыЭксперты

В интернете прогрессирует языковое неравенство

1 апреля 2015
Независимо от того, как активно различные проекты, например Google Loop или спутники SpaceX, будут развиваться для предоставления доступа к Сети в места, где его сейчас нет, это не изменит того, что практически весь контент в интернете предоставлен на ограниченном числе языков. Эта ситуация замедляет процесс обращения к Сети со стороны лиц, кому распространенные языки непонятны.

Количество контента в интернете по языкам

Согласно оценкам Всемирного банка, 80% контента в интернете доступно всего на 10 языках: английском, китайском, испанском, японском, арабском португальском, немецком, французском, русском и польском (постоянно соревнуется с корейским). Примерно три миллиарда населения (то есть, меньше половины) говорят на одном из этих языков в качестве первого. При этом более половины информации в Сети подано на английском языке, который понимает только 21% населения (и 27% пользователей с интернет-доступом) согласно данным GSMA и Mozilla. В качестве примера компании приводят, что менее 0,1% веб-контента представлено на хинди, родном языке для более, чем 260 миллионов жителей планеты, а арабский, входящий в десятку самых популярных, представлен только 3% всей информации в сети. Носителей языка при этом насчитывается около 240 миллионов.

Ситуацию подтверждает и статистика «Википедии» — наибольшее число статей энциклопедии представлено на английском языке, уже более 4 миллионов. Ни один другой язык не насчитывает число, превосходящее 2 миллиона. Что еще более наглядно, только 15 других языков преодолели отметку в 500 000 статей, а 7002 языков не представлены в «Википедии» в принципе.

Впрочем, у данной проблемы есть и логичное объяснение — целостность развития многоязычного сегмента Сети возможно при активном и монолитном сообществе, которое будет увеличивать объем таких материалов, однако для этого необходимо и иметь соответствующую группу читателей, причем в идеальных условиях, проживающую локально, что обеспечило успех актуальным лидерам. И именно эти языки продолжают развиваться активнее остальных.

Развивающиеся страны, на долю которых приходится 94% населения, не имеющих доступа к Сети, сильно сегментированы по языковому принципу. Например, в только в Индии, второй по численности населения на планете стране, насчитывается около 425 различных языков, что даже при появлении повсеместного интернета буквально у каждого человека серьезно ограничит их возможности, в частности, из-за низкого уровня образования в таких странах и незнания иностранных языков.

Таким образом, возникает вопрос о целесообразности широкого предоставления доступа, в первую очередь, с коммерческой точки зрения, а также необходимости обеспечения интернетом всего населения в принципе, по крайней мере, на данный момент. С другой стороны, его систематическое удешевление, а также вседоступность могут привести и к другому результату — ускоренному росту популярности того или иного, узко представленного в интернете языка, носителями которого является большое число людей.