Перегляд за Автор "Мельник, І. Є."
Зараз показано 1 - 1 з 1
Результатів на сторінку
Параметри сортування
- ДокументІНТЕРКОРПУСНИЙ АНАЛІЗ ЛЕКСИКО-СЕМАНТИЧНИХ ЗВ’ЯЗКІВ У СУЧАСНИХ МОВАХ(Ужгородський національний університет; Видавничий дім «Гельветика», 2023) Мельник, І. Є.; Ткаченко, Л. М.; Калініченко, Т. М.Корпусний аналіз має давню традицію в лексичній семантиці. Завдяки розвитку комп’ютерів і доступності великих електронних корпусів лексикологи та лексикографи мають у своєму арсеналі велику кількість надійних матеріалів, які формують значну емпіричну базу даних для описових досліджень. Для аналізу великих обсягів даних лексикографи використовують інструменти статистичного аналізу, які полегшують етап корпусного аналізу. Статистичні методи дають змогу виявити контекстуальні підказки, як-от паралельні слова (фрази) та синтаксичні моделі (граматичні вирази та словосполучення), щоб досліджувати лексичні значення з корпусних даних. З іншого боку, ці методи класифікують входження лексем за різними значеннями, які потім можна використовувати відповідно до контекстуальних підказок. В аналізі колокацій статистичний аналіз автоматизує ідентифікацію контекстуальних підказок, тоді як класифікація подій і типів залишається на розсуд інтеркорпусного аналізу. В цій статті представлено основні особливості та найважливіші референції різних підходів і підтипів, а також проілюстровано принципи інтеркорпусного розподільного аналізу на прикладі демомоделі розподілу. Розглянуто також лексичні програми для аналізу полісемії. До того ж, описано метод візуалізації, який дає змогу інтерпретувати семантичні структури, описані семантичною дистрибутивною моделлю. Ця стаття презентує метод дистрибутивного аналізу, який розглядається як логічне продовження статистичних методів, на яких ґрунтується аналіз лексико-семантичних відношень у сучасних мовах. В цій статті описано потенціал розподільного семантичного моделювання для міжкорпусного аналізу. Описано закономірності статистичного інструментарію, який використовується в лексичній семантиці. Інтеркорпусні моделі дають змогу вивчати слова або на рівні типів, або на рівні токенів. Моделі на рівні типів не тільки пояснюють, що одне слово відрізнятиметься від іншого, але й виявляють синонімію та пов’язані з ним лексичні зв’язки. The corpus analysis has a long tradition in lexical semantics. Thanks to computers and the availability of larger electronic corpora, lexicologists and lexicographers now have large amounts of reliable data at their disposal, which constitute a vast empirical database for their descriptive work. In order to analyse large amounts of data, lexical semantics researchers use statistical analysis tools that facilitate the stages of corpus analysis. Statistical methods allow identifying contextual clues in the corpus data to learn the meaning of a lexeme, such as parallel words (phrases) and syntactic patterns (grammatical phrases or collocations). On the other hand, these methods allow you to classify the occurrence of a token in different meanings and use it according to contextual indices. Collocation analysis has automated the identification of contextual clues through statistical analysis, but it leaves the classification of events and types to intercorpus analysis. The paper presents the main features and most important references for different approaches and subtypes, and explains the principles of intercorpus distributional analysis with an example of a demo distribution model. The lexicological application for polysemy analysis is discussed. Finally, a visualisation method is presented that allows for the interpretation of semantic structures defined by semantic distribution models. This paper presents methods of distributional analysis, which we consider to be a logical continuation of the statistical state of the art on which the analysis of lexical-semantic relations in modern languages is based. The regularities of statistical tools used in lexical semantics are described. Intercorpus models allow learning words either at the level of types or at the level of tokens. Type-level models not only explain how one word is different from another, but also reveal synonymy and related lexical relations.