Государственные органы, бизнес и обычные люди смогут получить доступ к специальным данным, созданным для обучения и проверки программ искусственного интеллекта (ИИ). Эту информацию подтвердил представитель помощника премьер-министра Дмитрия Григоренко.
Согласно информации, уже в феврале 2025 года государственные учреждения и разработчики ИИ смогут заключить соглашения и бесплатно получить доступ к таким данным. Все это происходит в рамках федерального проекта Искусственный интеллект, который является частью национального проекта Экономика данных. Данный проект контролируется помощником премьер-министра.
Разметка данных — это процесс присвоения определенных меток или категорий, который делает информацию понятной для программ машинного обучения. Подготовленные наборы данных созданы на основе исходных массивов информации без персональных данных граждан или информации, относящейся к охраняемой законом тайне.
Формирование этих наборов осуществляется через Единую информационную платформу Национальной системы управления данными. Уже были созданы первые 10 наборов данных в 2023 году, а в ноябре 2024 года добавлены еще 40, входящих в федеральный проект Искусственный интеллект.
В основном в данных массивах содержатся фото- и видеоматериалы, которые могут использоваться для обучения программ в различных областях, таких как управление городской средой, транспорт, экология и сельское хозяйство. Например, в 2024 году была проведена разметка данных с беспилотных летательных аппаратов и спутников, что помогло определить категории транспортных средств, состав лесов и классификацию земель сельскохозяйственного назначения.
Министерство цифрового развития отвечает за передачу этих данных. Были подготовлены проекты соглашений для государственных учреждений и частных лиц. В таких соглашениях оговариваются цели обмена информацией, сроки передачи и использования данных, гарантии их защиты от несанкционированного распространения.
Соглашения о предоставлении размеченных данных для обучения ИИ будут заключаться с региональными ведомствами и организациями, ответственными за внедрение технологий ИИ на местном уровне. Это поможет ускорить разработку и практическое использование ИИ.
Запросы на доступ к таким данным уже поступили из Тюменской и Липецкой областей. В Тюменской области планируют использовать данные для управления городской инфраструктурой, а в Липецкой — для обучения алгоритмов распознавания изображений.
Предоставление открытого доступа к данным является ключевым для развития технологий ИИ в экономике и социальной сфере. Это также поможет ускорить процесс импортозамещения в области ИИ и повысить качество моделей. Эксперты отмечают, что это даст российским компаниям и организациям конкурентные преимущества перед западными корпорациями в области информационных технологий.
Государственные данные откроют разработчикам ИИ в феврале
