В МГУ искусственный интеллект научили распознавать тексты, созданные нейросетью.
Ученые факультета вычислительной математики и кибернетики вуза на основе метода распознавания текста научились отличать правдивые отзывы в интернете от вымышленных текстов. Об этом сообщает сайт МГУ имени Ломоносова.
Всем известно, отзывы в Сети на товары и услуги значительно влияют на выбор пользователей. Также, не является секретом и то, что с развитием технологий отзывы в интернете часто пишет специально обученный бот. Например, это умеет делать нейросеть ChatGPT.
Внедрение метода ученых МГУ позволит отличать тексты ИИ от написанных человеком.
«Уникальность данной работы состоит в рассмотрении конкретного жанра текста (интернет-отзывов) и применения современных методов распознавания к текстам на русском языке», — говорят сотрудники кафедры алгоритмических языков МГУ.
В качестве метода распознавания реальной письменной речи ученые МГУ выбрали языковую модель ruRoBERTa, которая создавалась специально для обработки русскоязычных текстов. Во время исследования аналитики собрали данные на страницах маркетплейсов, на полученных отзывах дообучили нейросеть, затем сгенерировали машинный текст и создали сбалансированный набор данных.
Полученный набор сведений был использован для обучения ИИ. В результате, вновь обученная нейросеть с высокой степенью вероятности (86%) распознала автоматически созданные тексты. Самую большую трудность для искусственного интеллекта составило распознавание коротких отзывов.
«Мы предполагаем, что это связано с распространенностью некоторых общих фраз в отзывах, на которых обучалась модель», — уточнили исследователи.
Ранее Эпиграф.инфо рассказывал, что нейросеть показала, как будет выглядеть Россия в будущем.
Фото: freepik