Article: PDF
DOI: 10.51762/1FK-2021-26-02-07
Аннотация: Статья посвящена обсуждению основных подходов в рамках корпусной лингвистики и их влиянию на общее развитие лингвистических знаний. На примере исследований, выполненных при участии автора, обсуждаются три подхода к изучению языка в корпусной лингвистике. Первый – анализ, использующий корпус, – предполагает, что данные, собранные в корпусе, используются как источник примеров на естественном языке. Второй – анализ, основанный на корпусе, – заключается в том, что корпусные данные исследуются не только качественно, но и количественно. Третий – анализ, направляемый корпусом, – предполагает, что задача исследователя состоит в создании алгоритма обработки языковых данных, результат которого требует теоретического осмысления или практического применения. Статья завершается обсуждением тех результатов, которые корпусная лингвистика привносит в общее представление о языке и лингвистике. Важнейшими из них являются: снижение роли интроспекции, увеличение внимания к периферийным языковым феноменам, опора на количественные данные. Подводить итоги влияния корпусной лингвистики на общую теорию языка еще рано, но уже сейчас ясно, что синтагматические связи, в частности идиоматизация в широком смысле, продвинулись в центр лингвистического внимания и признаются одним из основных феноменов языка и его эволюции. Более того, адекватным описанием языка оказывается не моделирование правил взаимодействия единиц, разделенных на уровни, а описание всех – и индивидуальных, и самых общих – вероятностных параметров употребления, представляющих собой единый континуум, в котором разделение на язык и речь является условным.
Ключевые слова: Корпусная лингвистика; теория языкознания; лингвистические исследования.

Для цитирования:

Копотев, М. В. О некоторых следствиях корпусной лингвистики для общей теории языка / М. В. Копотев // Филологический класс. – 2021. – Том 26 ⋅ №2. – С. 90-102. DOI 10.51762/1FK-2021-26-02-07.

For citation

Kopotev, M. V. (2021). Some houghts on Corpus and General Linguistics. In Philological Class. 2021. Том 26 ⋅ №2. P. 90-102. DOI 10.51762/1FK-2021-26-02-07.

Об авторе (авторах) :

Копотев М. В.

Высшая школа экономики (Санкт-Петербург, Россия) Хельсинкский университет (Хельсинки, Финляндия)

ORCID ID: https://orcid.org/0000-0002-4998-2952

Список литературы:

Величко, А. В. Предложения фразеологизированной структуры в русском языке. Структурно-семантическое и функционально-коммуникативное исследование / А. В. Величко. – Москва : МАКС Пресс, 2016.

Влахов, А. В. Причастия будущего времени в русском языке : выпускная квалификационная работа бакалавра филологии / Влахов А. В. – СПб. : СПбГУ, 2010.

Копотев, М. В. Введение в корпусную лингвистику : учебное пособие для студентов филологических и лингвистических специальностей университетов / М. В. Копотев. – Praha : Animedia Company, 2014. Материалы для проекта корпусного описания русской грамматики. – URL: http://rusgram.ru (дата обращения: 12.05.2021). – Текст : электронный.

Мельчук, И. А. Смысл и сочетаемость в словаре / И. А. Мельчук, Л. Н. Иорданская. – Москва : Языки славянских культур, 2017.

Морозов, Н. А. Лингвистические спектры: cредство для отличения плагиатов от истинных произведений того или другого известного автора / Н. А. Морозов. – Петроград : Тип. Имп. Акад. наук, 1916. – 42 с.

Рахилина, Е. В. Лингвистика конструкций / Е. В. Рахилина. – Москва : Азбуковник, 2010.

Хохлова,  М.  В. Экспериментальная проверка методов выделения коллокаций / М.  В.  Хохлова // Slavica Helsingiensia. – Хельсинки : Unigrafia, 2008. – С. 343–357.

Черемисина, М. И. Очерки по теории сложного предложения / М. И. Черемисина, Т. А. Колосова. – Новосибирск : Наука, 1987.

Шанский, Н. М. Фразеология современного русского языка / Н. М. Шанский. – Москва : URSS, 2010.

Ягунова, Е. В. Природа коллокаций в русском языке. Опыт автоматического извлечения и классификации на материале новостных текстов / Е. В. Ягунова,

Л. М. Пивоварова // Научно-техническая информация. Серия 2. – 2010. – Т. 2. – С. 30–40. ACTFL proficiency guidelines. – Alexandria, VA, 2012.

Ädel, A. Corpus Compilation / A. Ädel // A Practical Handbook of Corpus Linguistics / ed. by M. Paquot, S. Gries. – New York : Springer, 2020. – P. 3–24.

Anthony, L. AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit / L. Anthony // Proceedings of IWLeL. – 2004. – P. 7–13.

Barlow, M. Usage-based models of language / M. Barlow, S. Kemmer. – Stanford, CA : Center for the Study of Language and Information, 2000.

Devlin, J. BERT: pre-training of deep bidirectional transformers for language understanding / J. Devlin et al. – Text : electronic // arXiv preprint arXiv:1810.04805. – 2018. – URL: https://arxiv.org/abs/1810.04805 (mode of access: 28.05.2021).

Du Bois, J. W. Competing motivations / J. W. Du Bois // Iconicity in syntax. – 1985. – Vol. 6. – P. 343–365. Evert, S. Corpora and collocations / S. Evert // Corpus linguistics. An international handbook. – 2008. – Vol. 2. – P. 1212–1248.

Fillmore, C. J. Corpus linguistics or Computer-aided armchair linguistics / C. J. Fillmore // Directions in corpus linguistics / ed. by J. Svartvik. – Berlin ; New York : de Gruyter Mouton, 2011. – P. 35–60.

Firth, J. Papers in Linguistics / J. Firth. – London : Oxford University Press, 1957. Goldberg, A. E. Constructions at work: The nature of generalization in language / A. E. Goldberg. – London : Oxford University Press, 2006.

Hunston, S. Pattern grammar: A corpus-driven approach to the lexical grammar of English / S. Hunston, G. Francis. – Amsterdam : John Benjamins Publishing, 2000.

Jakubíček, M. The TenTen corpus family / M. Jakubíček et al. // 7th International Corpus Linguistics Conference CL. – 2013. – P. 125–127.

Janda, L. A. Constructions, their families and their neighborhoods: the case of durak durakom ‘a fool times two’ / L. A. Janda, M. V. Kopotev, T. Nesset // Russian Linguistics. – 2020. – P. 1–19. Kilgarriff, A. The Sketch Engine: ten years on / A. Kilgarriff et al. // Lexicography. – 2014. – Vol. 1, № 1. – P. 7–36.

Kisselev, O. Syntactic complexity measures as indices of language proficiency in writing: focus on heritage learners of Russian / O. Kisselev, A. Klimov, M. Kopotev // Heritage Language Journal. A Special Issue on Heritage Language Complexity. 2021 (в печати).

Kopotev, M. Corpora in Text-Based Russian Studies / M. Kopotev, A. Mustajoki, A. Bonch-Osmolovskaya // The Palgrave Handbook of Digital Russia Studies. – Cham : Palgrave Macmillan, 2021. – P. 299–317.

Kopotev, M. Russian challenges for quantitative research / M. Kopotev, O. Lyashevskaya, A. Mustajoki // Quantitative approaches to the Russian language. – Routledge, 2018. – P. 3–29.

Kutuzov, A. WebVectors: A Toolkit for Building Web Interfaces for Vector Semantic Models / A. Kutuzov, E. Kuzmenko // International Conference on Analysis of Images, Social Networks and Texts. – 2017. – Vol. 661. – P. 155–161.

Lakoff, G. Women, fire, and dangerous things: What categories reveal about the mind / G. Lakoff. – University of Chicago press, 2008. Langacker, R. W. A dynamic usage-based model / R. W. Langacker // Grammar and Conceptualization. – Amsterdam : De Gruyter Mouton, 2010. – P. 91–146.

MacWhinney,  B.  E. Competing motivations in grammar and usage / B.  E.  MacWhinney, A.  E.  Malchukov, E. E. Moravcsik. – London : Oxford University Press, 2014. McEnery, T. Corpus Linguistics: An Introduction / T. McEnery, A. Wilson. – Edinburgh : Edinburgh University Press, 1996.

Mikolov, T. Efficient estimation of word representations in vector space / T. Mikolov et al. – Text : electronic // arXiv preprint arXiv:1301.3781. – 2013. – URL: https://arxiv.org/abs/1301.3781 (mode of access: 28.05.2021).

Nichols, J. Predicate nominals: A partial surface syntax of Russian / J. Nichols. – Los Angeles : Univ. of California Press, 1981. Peters, M. E. Deep contextualized word representations / M. E. Peters et al. – Text : electronic // arXiv preprint arXiv:1802.05365. – 2018. – URL: https://arxiv.org/abs/1802.05365 (mode of access: 28.05.2021).

Pivovarova, L. Evaluation of collocation extraction methods for the Russian language / L. Pivovarova, D. Kormacheva, M. Kopotev // Quantitative Approaches to the Russian Language. – Routledge, 2017. – P. 137–157.

Scott, M. Developing Wordsmith / M. Scott // International Journal of English Studies. – 2008. – Vol. 8, № 1. – P. 95–106. Sinclair J. Lexical grammar / J. Sinclair // Naujoji Metodologija. – 2000. – Vol. 24. – P. 191–203.

Sinclair, J. Corpus, concordance, collocation / J. Sinclair. – Oxford University Press, 1991.

Stefanowitsch, A. Collostructions: Investigating the interaction of words and constructions / A. Stefanowitsch, S. T. Gries // International journal of corpus linguistics. – 2003. – Vol. 8, № 2. – P. 209–243.