В человеческом геноме десятки тысяч генов, «отвечающих» за те или иные характеристики нашего организма. Каждому гену дано уникальное имя и алфавитно-цифровой код, который ученые используют в своих исследованиях. Однако за последний год нескольким генам пришлось придумывать новые названия. Все из-за того, что Microsoft Excel считывала символы как даты. Об этом сообщает The Verge.
Впрочем, проблема не стала абсолютно неожиданной. Excel регулярно используется в научных работах и при клинических испытаниях. Стандартные настройки программы предполагают выполнение более приземленных задач. Поэтому при вводе кода MARCH1 (сокращенное название Membrane Associated Ring-CH-Type Finger 1) Excel преобразует его в «1 марта».
Это не только мешает работе исследователей, но и несет более серьезные проблемы, учитывая, что ученым приходится исправлять ошибки программы вручную. Сбои при работе с Excel настолько распространены, что их можно обнаружить даже в работах, получивших экспертную оценку научного сообщества. В 2016 году исследователи проанализировали 3597 публикаций и обнаружили, что примерно пятая часть работ пострадала от ошибок в работе программы.
На помощь пришел отдельный научный орган HUGO Gene Nomenclature Committee (HGNC), который утверждает уникальные и значимые имена для всех известных человеческих генов. Комитет опубликовал новые рекомендации по присвоению имен генам. Теперь их называют с оглядкой на форматирование Excel. То есть MARCH1 стал MARCHF1, SETP1 — SEPTIN1 и так далее. Подобным образом уже переименовано 27 генов.
Названия генов во многом определяется консенсусом, как это происходит при обновлении словарей. Большая часть научного сообщества обрадовалась новому регламенту, но были несогласные. Главный вопрос противников: «Почему нельзя просто обновить Excel?»
В Microsoft никак не комментировали эту проблему. По словам координатора HGNC Элспет Бруфорд, это не стоит беспокойства разработчиков в масштабах всех сценариев использования Excel.
Это тоже интересно: