Петербург тестирует систему электронного голосования
Опубликованно 28.05.2020 14:50
Конкурс Up Great PRO//ЧТЕНИЯ, организованного РВК, Фонд "Сколково" и АСИ, готовится принять важный технологический барьер. Искусственный интеллект должен "понять" текст, написанный человеком, после выявления семантических, логических и фактических ошибок на уровне школьный учитель, проверяющий эссе в течение ограниченного времени. Корреспондент РИА новости Олег Нас выяснил подробности автора технический регламент конкурса, руководитель лаборатории искусственного интеллекта Центр экспертиза "Искусственный интеллект" МФТИ Константин Воронцов.
- Какие научные и технологические задачи поможет решить конкурс PRO//ЧТЕНИЯ? Если вы можете проецировать этот конкурс для глобальной тенденции в развитии ИИ?
- Это отрасли, технологий искусственного интеллекта, как понимание компьютером естественного человеческого языка. В более общем смысле, эта задача является слишком широким, и он должен точно. Мы подошли к ней с позиций найти искусственный интеллект, семантические ошибки в тексте. Здесь вы играете в заранее: для этой операции, пока мало кто берется, потому что это слишком сложно. Но она важна и востребована, так что перед нами открывается возможность не отставать в очереди мира И лидеров, и сделать реальный шаг вперед в глобальном масштабе.
Важно, что конкурс предусматривает разделение на системы обработки русскоязычных и англоязычных текстов, а также участие в гонке могут принять как российские, так и иностранные команды. В этом случае, для того, чтобы решить проблему, разработчики могут использовать любое программное обеспечение и вычислительные мощности. Без ограничений, все более и более открыто. Регистрация осуществляется на сайте Up Great.
- Каков технологический барьер ПРОФИ//ЧТЕНИЯ? Каковы критерии для его преодоления? И в определенный момент окончательное испытание для организаторов конкурса смогут заявить: "Да, барьер взял"?
- Задача команд состоит в том, чтобы создать систему, которая быстро выявляет смысловые ошибки и дает их объяснение. В частности, это неправильное или недостаточное раскрытие темы, раздираемой на логику, реальные ошибки. Мы остановились на конкретной форме выполнения письменных заданий, которые студенты пишут в рамках РАССМОТРЕНИЯ. Потому что ЭКЗАМЕН? Во-первых, уже существуют устоявшиеся годами правила, поэтому, деятельности, управления легче оформить. Во-вторых, если в результате конкурса удалось создать инструмент, который помогает учителям быстрее и лучше проверить, на национальном уровне, может быть огромная экономия труда.
Задачи тестирования происходят, как правило, двух-трех экспертов. И часто расходятся в оценках фактов и средней школы рабочей. Алгоритмы, которые создают участники конкурса, в своих оценках сочинения должны расходиться не более сильные, которые контролируют их люди. Таким образом, технологический барьер ПРОФИ//ЧТЕНИЯ будет считаться пройденным, если алгоритм работает на уровне профессиональных экспертов.
- Материалы конкурса изобилуют терминами, которые могут быть непонятными для непрофессионалов: "разметку набор данных", "восстановление данных". Объясните, пожалуйста, значение этих терминов в связи с конкурсом. Как эти элементы помогут вам в решении поставленной задачи – анализировать текст не хуже человека?
- Эта терминология принята в машинного обучения и анализа текстов. Размеченный образец, содержит данные о том, как люди решили, конечно, достаточно сложная интеллектуальная задача. Машинного обучения строит алгоритм, который решает эту задачу примерно так же. В тест-образец проверил, насколько хорошо алгоритм в состоянии сделать это. На этом принципе устроены все конкурсы для анализа данных. На платформе Kaggle, например, сотни конкурсов для различных задач.
В нашем случае, участники конкурса будут обеспечены размечены школьные сочинения, которые они проверили сертификаты педагогов, не один год работы с ЕГЭ. Как правило, проверка школьной эссе, учитель отмечает ошибки красной ручкой и пишет на полях замечания. Наш язык разметки позволяет сохранять эти записи в текст, так что они понятны и человек, и компьютер. После того, как получил отбора работ, алгоритм должен понять, какие принципы учителя заметили ошибки, и научиться делать эту работу не хуже.
"Разметка набора данных" в нашем случае – это организация сбора и накопления в цифровом виде проверенные работы студентов. Теперь разметки набора данных организация-оператор конкурса - MERS. Я надеюсь, что в ходе конкурса будет создан сервис для дистанционной работы репетитор ЭКЗАМЕН. Возможно, это будет независимая компания. Искусственный интеллект будет помогать наставник, чтобы сделать управление лучше и быстрее, параллельно, учусь в накапливается огромное количество данных.
- Какова была реакция учителя, которых пригласили к созданию образцов, не было их забот из-за появления ИИ в процессе оценки ЭКЗАМЕН?
- Технологии помогают людям в решении их повседневных задач. ИИ не может заменить живого общения учителя и ученика. В общем, "искусственный интеллект" является впечатляющим термин, введенный в середине прошлого века. Но все мировые ученые, которые работают в этой сфере, не перестают повторять, что ИИ не более чем имитация интеллекта человека для решения узких профессиональных задач. Это не замена мужчине, и помощник, свободный от рутины.
В нашем случае речь идет о создании инструмента, который поможет учителям проверить написанные быстрее. Это своего рода "суфлер", специализированный поисковик для обнаружения семантических ошибок в тексте. Не секрет, что учителя не любят проверять ЕГЭ. Мы хотим помочь им избавиться от этой рутинной работы, или, по крайней мере, уменьшить его объем. Для того, чтобы закончить могли посвятить больше времени своим ученикам. Система single sign-on осаку на инструмент измерения результатов обучения, но само обучение, несомненно, должно происходить в прямом эфире.
Когда мы обсудили с учителями методику разметки сочинения, я был приятно удивлен их положительные отзывы. Строгой формализации, когда необходимо точно указать фрагмент ошибки, тип ошибки и ее объяснение, здорово дисциплинирует мысли. Так что даже и уменьшить количество разногласий между инспекторами экспертов. Таким образом, с учителями, в этом мы согласны, что конкурс позволяет выполнять важные и очень необходимые социальную функцию, что выходит за рамки только технологических вызовов.
- И как эта технология помогает учащимся, для которых ЭКЗАМЕН, как правило, достаточно трудное испытание?
- Получат возможность тренироваться писать сочинения без ошибок. Успешные мужчины, возможно, это не так необходимо, но многие студенты, вы должны писать больше тестов, написанных, чтобы хорошо подготовиться к ЭКЗАМЕНУ. И вы в состоянии сделать, не обращаясь к учителя или репетитора. Система автоматически проверяет ошибки, и этот процесс будет намного быстрее и дешевле, чем репетитор. Система будет доступна в режиме 24/7, во всех регионах, в том числе отдаленных, где часто не хватает квалифицированных специалистов. Но это будущее, к которому придется идти, возможно, не один год.
Что касается апелляции и возможных конфликтных ситуаций по результатами ЕГЭ, здесь ничего не изменится. Последнее слово всегда будет за профессиональных преподавателей, и на данном этапе не важно, как была обнаружена ошибка – если эксперт или ИИ предложил.
- Где, на ваш взгляд, в дополнение к сфере образования, можно использовать такую технологию?
- Приложение может быть очень широким. На первом этапе мы выбрали школьные сочинения и ЕГЭ, так как в этой области существует возможность четко формализовать критерии. В связи с творческим процессом создания текста, произведения искусства можно говорить об автоматизации процедуры проверки. Если система поможет вам найти и лингвистических, логических, фактических и других ошибок, семантических, это будет большим подспорьем, например, для начинающих журналистов или писателей. И издатели приедут более чистые тексты. Соответственно, они будут иметь больше времени для работы с материалом с точки зрения содержания.
Обнаружение противоречия и логические ошибки в текстах, может стать важным элементом технологии для обнаружения подделок, орехи тексты, недостоверной информации. Выяснить противоречия с другими материалами на ту же тему, ИИ не в состоянии дать ссылки на более надежные источники информации. Подобных приложений может выглядеть немного, в самых разных сферах.
- И как алгоритм работает с сложных языков, например, Юго-Восточной Азии, есть специфика?
- В каждом языке имеются семантические, синтаксические, лексические языковые конструкции. Для того, чтобы сотни языков, наиболее распространенных технологий автоматической обработки текстов уже разработаны и постоянно совершенствуются. Для редких языков такие исследования ведутся во всем мире. Фундаментальной общности всех человеческих языков, связанный с устройством нашего мозга, как и все мы, размещения, учится, развиваться в обществе. Поэтому, на мой взгляд, наши технологии применимы для всех языков. Конечно, лингвисты, специалисты в каждом конкретном языке, вы, безусловно, нужно в процессе развития системы и ее дальнейшего совершенствования.
- Расскажите, в целом, занимается лаборатория в МФТИ.
- Мы участвуем в различных задач искусственного интеллекта, в том числе анализа текстов и поиска информации. Он разработал свою библиотеку с открытым исходным кодом для тематического моделирования больших текстовых коллекций. Тематические модели способны автоматически определять тему документы и посмотрите тексты со смыслом, и не для ключевых слов. Для вычисления скорости и гибкости нашего развития не имеет себе равных, именно в этой довольно узкой области, мы на глобальном уровне. На ее основе мы создали сервис, который помогает исследователям быстро, в течение нескольких минут, чтобы забрать выбор десятки научных статей на любую тему, представляющую интерес. Теперь создаем следующий сервис, который помогает на пару часов, чтобы написать качественный обзор для выбранной коллекции. Одни и те же методы могут быть применены для дистанционного обучения, для поиска информации на успешные проекты, и положительные инициативы, для восстановления объективной картины событий для новостей. Миссия все эти исследования – донести до сознания людей, чтобы сделать знания более доступными и понятными.
Категория: Технологии