Количество контента в интернете по языкам
Согласно оценкам Всемирного банка, 80% контента в интернете доступно всего на 10 языках: английском, китайском, испанском, японском, арабском португальском, немецком, французском, русском и польском (постоянно соревнуется с корейским). Примерно три миллиарда населения (то есть, меньше половины) говорят на одном из этих языков в качестве первого. При этом более половины информации в Сети подано на английском языке, который понимает только 21% населения (и 27% пользователей с интернет-доступом) согласно данным GSMA и Mozilla. В качестве примера компании приводят, что менее 0,1% веб-контента представлено на хинди, родном языке для более, чем 260 миллионов жителей планеты, а арабский, входящий в десятку самых популярных, представлен только 3% всей информации в сети. Носителей языка при этом насчитывается около 240 миллионов.
Ситуацию подтверждает и статистика «Википедии» — наибольшее число статей энциклопедии представлено на английском языке, уже более 4 миллионов. Ни один другой язык не насчитывает число, превосходящее 2 миллиона. Что еще более наглядно, только 15 других языков преодолели отметку в 500 000 статей, а 7002 языков не представлены в «Википедии» в принципе.
Впрочем, у данной проблемы есть и логичное объяснение — целостность развития многоязычного сегмента Сети возможно при активном и монолитном сообществе, которое будет увеличивать объем таких материалов, однако для этого необходимо и иметь соответствующую группу читателей, причем в идеальных условиях, проживающую локально, что обеспечило успех актуальным лидерам. И именно эти языки продолжают развиваться активнее остальных.
Развивающиеся страны, на долю которых приходится 94% населения, не имеющих доступа к Сети, сильно сегментированы по языковому принципу. Например, в только в Индии, второй по численности населения на планете стране, насчитывается около 425 различных языков, что даже при появлении повсеместного интернета буквально у каждого человека серьезно ограничит их возможности, в частности, из-за низкого уровня образования в таких странах и незнания иностранных языков.
Таким образом, возникает вопрос о целесообразности широкого предоставления доступа, в первую очередь, с коммерческой точки зрения, а также необходимости обеспечения интернетом всего населения в принципе, по крайней мере, на данный момент. С другой стороны, его систематическое удешевление, а также вседоступность могут привести и к другому результату — ускоренному росту популярности того или иного, узко представленного в интернете языка, носителями которого является большое число людей.