Третье место конкурса «КОД науки» в номинации
«Филологические исследования» (2024 г.)
Аннотация. Статья посвящена изучению возможностей искусственного интеллекта в исследовании семантики неологизмов. Проводится анализ значений неологизмов с использованием нейросети DeepSeek, которая специализируется на обработке текстов.
Ключевые слова: неологизм, семантика, искусственный интеллект, нейросеть DeepSeek.
Язык – это постоянно развивающаяся динамическая система. Он способен быстро адаптироваться к стремительным изменениям в жизни общества и фиксировать важные нововведения в экономической, политической, социальной и научно-технической сфере. Словарный состав языка постоянно пополняется новыми единицами, неологизмами, которые позволяют не только проследить развитие языка, но и обнаружить изменения в развитии общества, его социальных отношений и ценностей [3, с. 171].
Неологизмы или новообразования – это слова, словосочетания или выражения, недавно появившиеся в языке для обозначения новых предметов, понятий, признаков и явлений, и еще не вошедшие полностью в активный словарный состав языка, либо приобретшие новое значение в определенный период времени. Среди ключевых характеристик неологизмов можно выделить новизну.
Следует отметить динамичность неологизмов. Некоторые новообразования закрепляются в языке, другие исчезают. Кроме того, неологизмы могут быть ограничены в употреблении, если они имеют узкую сферу употребления, быстро устаревают из-за изменений в обществе, имеют социально-географическую ограниченность.
По источнику происхождения различают лексические, семантические, заимствованные неологизмы и окказионализмы. Неологизмы могут появляться в языке путем заимствования из других языков. В отличие от семантических неологизмов, старых языковых форм с новыми значениями, лексические неологизмы представляют собой новые языковые формы, которые обычно используются в широком употреблении. Также выделяем окказионализмы как индивидуально-авторские новообразования.
В настоящее время в исследовании языка всё более значимую роль играет искусственный интеллект. Под искусственным интеллектом понимается «комбинация разных компьютерных систем, которые позволяют машинам выполнять ранее присущие людям задачи» [2, с. 25], то есть. задачи, требующие человеческого интеллекта. Они способны обрабатывать информацию, делать выводы и обучаться на основе данных. Одним из методов искусственного интеллекта являются нейросети. Они представляют собой математическую модель, имитирующую работу нейронов человеческого мозга Эта модель состоит из слоев взаимосвязанных узлов, которые обрабатывают данные и учатся на примерах. [2, с. 26].
Нейросеть становится незаменимым помощником и в изучении неологизмов благодаря своей способности быстро и эффективно обрабатывать большие объемы текстовых данных, включая новости, блоги, посты в соцсетях. Она может не только фиксировать появление неологизмов быстрее, но и анализировать контекст употребления, что позволяет лучше понять значения новых слов.
В рамках данного исследования мы проанализировали семантические значения английских неологизмов, отобранных из публицистического дискурса. Для анализа мы использовали подвид нейросетей, а именно DeepSeek, который специализируется на обработке текстов.
Нами были проанализированы неологизмы, представленные в интернет-версии британского издания The Guardian и онлайн-ресурса BBC Learning. Корпус неологизмов составили следующие единицы: skychology, novid, hipstoric, frenemy, quaranteam, Mpox, panpanic, screenager, fitspiration, workation, sadfishing, listicle, smombie, chillax, bridezilla, cyberchondriac, Lit, staycation, stuffocation, hangry, sober-curious, awesomesauce, hellacious, side-eye, photobomb, lookbook, fitspiration, froyo, B-day, whatevs, mansplain, facepalm, laptoppers, four-top, tip-tapping, thinktank, algorithmicallydriven, quippy, cash-in, plasticky tat, trans-slender, gaslighting, ghosting, partygate, Swiftie, FOMO, YOLO, doomscrolling, rizz, catfishing, iFinger.
Всего нами было проанализировано 50 неологизмов. Нейросеть дала верное значение 46 словам. Частично неверно были определены значения 3 слов, что составляет 6% от общего количества слов, а абсолютно неверное значение было дано одному неологизму (2%). Эта статистика показывает, что ИИ DeepSeek достаточно точно и эффективно может определять значение неологизмов. Но, безусловно, существуют и ограничения в работе нейросетей, они могут ошибаться в определении значений новых слов (см. рисунок 1).
Рис. 1. Результаты семантического анализа с помощью ИИ
Интересно отметить, что DeepSeek понимает и правильно определяет значения неологизмов, образованных разными способами. Словам, образованным самой продуктивной словообразовательной моделью – словосложением, были даны верные значения. Например, four-top – столик в ресторане на четверых; facepalm – жест, при котором лицо закрыто одной ладонью из-за смущения, стыда, разочарования; thinktank – мозговой центр, sober-curious – трезвый образ жизни без необходимости полного отказа от алкоголя, awesomesauce обозначает энтузиазм и волнение, phone-yawn – случай, когда один человек достает телефон и смотрит на экран, в результате чего окружающие люди делают то же самое.
Слову screenager, образованному путем слияния слов screen и teenager – подросток, зависимый от цифровых устройств, также было дано верное значение. Аналогично образованные слова были интерпретированы искусственным интеллектом верно: workation (work + vacation) – работа во время отпуска; hangry (hungry + angry) – описывает состояние гнева или раздражительности, вызванное голодом; smombie (smartphone + zombie) – человек, поглощенный своим телефоном и не замечающий ничего вокруг; frenemy (friend + enemy) – мнимый друг, который на самом деле скрывает враждебность, соперничество или лицемерии.
У DeepSeek не вызвало затруднения дать значение неологизму, образованному способом аффиксации. Так, Swiftie (Swift + суффикс -ie) – фанат Тейлор Свифт, отличающийся особой преданностью; quippy (quip + суффикс -y) – остроумный. Слова-сокращения также были интерпретированы верно. Например, B-day (сокращение от birthday) – день рождения; whatevs (сокращение от whatever) – что угодно. Значения неологизмов, образованных путем конверсии, тоже были определены верно. Например, cash-in publications – публикации, направленные на получение прибыли. Важно заметить, что даже неологизму pancake people DeepSeek дал абсолютно верное значение. Он интерпретировал этот неологизм не через призму буквального значения слов pancake и people, а как одно целое. Pancake people – это современное поколение, часто использующие гаджеты.
Тем не менее, три неологизма из нашего списка DeepSeek определил частично верно. Неологизму push pen anxiety он дал следующее определение: «описывающий тревогу или стресс, связанный с использованием электронных стилусов для письма, рисования или работы на сенсорных устройствах». Хотя push pen anxiety это еще и нервное и бессмысленное нажатие на кнопку авторучки, как, например, в предложении Ben got push pen anxiety at school. Понимание контекстуального значения помогает нам осознать, насколько разнообразны могут быть наши интерпретации мира [4, с. 48].
Для неологизма iFinger DeepSeek предлагает три значения: сленговое название для Touch ID или цифрового ключа; боль или дискомфорт в пальце от частого скроллинга; привычка постоянно скроллить, бессознательно листать соцсети. Интересно заметить, что у этого слова есть еще одно значение. А именно, палец, который оставляют чистым для того, чтобы можно было продолжить пользоваться смартфоном/планшетом и не запачкать его (These ribs are delicious but I have to keep my iFinger clean).
Слову gaslighting нейросеть дала определение «форма психологического насилия, когда манипулятор заставляет жертву сомневаться в своей памяти/восприятии». Словарь Merriam Webster дает еще одно значение данного неологизма, совершенно иное – это ложная информация в СМИ, в интернете. Синонимами указаны слова fakenews и deepfake.
Одному неологизму DeepSeek дал абсолютно неверное значение. Данное слово воспринимается в языке как одно целое, не распадаясь на отдельные слова, поэтому нейросеть не может перевести их корректно. Нейросеть перевела неологизм trans-slender как «описание трансгендерных людей, чья внешность соответствует стройному, «худощавому» идеалу». В действительности имеется в виду состояние человека, который полный, но не идентифицирует себя таковым, смотря на физическую реальность (I’m fat but identify as skinny, I’m trans-slender).
Данный пример показывает, что нейросети имеют некоторые ограничения в работе с неологизмами и могут ошибаться в определении их значений. Можно предположить, что причиной этому могут быть данные сети. Нейросети имеют ограниченный размер словаря, самые новые слова попадают в них не сразу. Если нейросеть обучалась на корпусе текстов, в которых неологизм еще не появился или был редким, нейросеть может неправильно интерпретировать его [1, с. 6]. Кроме того, работа искусственного интеллекта основана на алгоритмах, он не способен осмыслить данные критически, как это делает человек, поэтому полная автоматизация понимания неологизмов пока невозможна.
Таким образом, нейросети способны точно определять значения неологизмов. Это возможно благодаря двум факторам. Во-первых, современные нейросети обучаются на огромных корпусах текстов, реальном языковом потоке. Во-вторых, нейросеть работает не только с отдельными словами, но и с контекстуальным анализом. Но важно учитывать, что в редких случаях ложная информация может быть представлена нейросетью как фактическая. В этом случае остается важной человеческая проверка.
Список литературы:
- Агальцова Д.В., Валькова Ю.Е. Технологии искусственного интеллекта для преподавателей ВУЗа // Мир науки, культуры, образования, 2023. №2(99). С. 5-7. (дата обращения: 06.04.2025).
- Багрова Н.А. Ежу понятно: идиоматические выражения русского языка глазами нейросети // Бархударовские чтения, РАУ, 2024. С. 25-28. (дата обращения: 06.04.2025).
- Колоскова О.А. Актуальные способы лексического состава английского языка (на материале слов года 2022-2023) // Вестник Самарского университета. История, педагогика, филология, 2024. С. 170-179. (дата обращения: 06.04.2025).
- Пустоведова В.К., Быкова Н.О., Тупикова С.Е. Между строк: понимание контекстуальных окказиональных значений человеком и искусственным интеллектом // Universum: филология и искусствоведение, 2025. №1(127). С. 45-48. (дата обращения: 06.04.2025).
Semantic analysis of English neologisms with neural networks
Volkova P.D.,
bachelor of 2 course of the Moscow City University, Moscow
Research supervisor:
Michugina Svetlana Viktorovna
Associate Professor, Department of English Language and Linguodidactics, Institute of Foreign Languages, Moscow City University, Candidate of Philological Sciences, Associate Professor
Abstract. The article deals with the possibilities of Artificial Intelligence in the study of semantics and neologisms. It studies the meanings of neologisms offered by the neural network «DeepSeek», which specializes in language processing.
Keywords: neologisms, semantics, Artificial Intelligence, neural network «DeepSeek».
References:
- Agaltsova D.V., Valkova Yu.E. Artificial intelligence technologies for university teachers // World of Science, Culture, Education, 2023. №2(99).: 5-7. (date of the address: 06.04.2025).
- Bagrova N.A. Yezha is understandable: idiomatic expressions of the Russian language through the eyes of a neural network // Barkhudar readings, RAU. 2024.: 25-28. (date of the address: 06.04.2025).
- Koloskova O.A. Actual methods of the lexical composition of the English language (based on the words of the year 2022-2023 ) // Bulletin of Samara University. History, pedagogy, philology, 2024.: 170-179. (date of the address: 06.04.2025).
- Pustovedova V.K., Bykova N.O., Tupikova S.E. Between the lines: understanding of contextual occasional meanings by man and artificial intelligence//Universum: philology and art history, 2025. №1(127).: 45-48. (date of the address: 06.04.2025).