Словари лингвистических терминов.

Словари лингвистических определений – разновидность отраслевых энциклопедических словарей, содержащие определения языкознания и их истолкование.

Первыми были маленькие по объему “Грамматический словарь” Н. Н. Дурново (1924 г.) и “Лингвистический словарь” Л. И. Жиркова (1946 г.). Более полным по составу является изданный на украинском языке, снабженный русским словником словарь лингвистических определений Е. В. Кротевича и Н. С. Родзевич Словари лингвистических терминов. (1957 г.), также “Словарь лингвистических определений” Академии Латвийской ССР (составители—Р. Грабис, Д. Барбаре, А. Бергмане, 1963 г.).

В ряде словарей обширно представлена терминология разных направлений структурализма. Таковы переводные “Словарь лингвистических определений” Ж. Марузо (1960 г.), “Лингвистический словарь Пражской школы” И. Вахека (1964 г.), “Словарь американской лингвистической терминологии” Э. Хэмпа (1964 г.).

Более полным Словари лингвистических терминов., отражающим современное состояние языковедческой науки, содержащим около 7 тыщ определений с переводом на британский язык и сравнениями из французского, германского и испанского языков, является “Словарь лингвистических определений” О. С. Ахмановой (1966 г.). Словарь содержит и разъясняет около 7 тыс. определений всех лингвистических дисциплин (фонетики, фо-номорфологии, морфологии, синтаксиса, лексикологии, лингвостилистики). Определения сопровождаются Словари лингвистических терминов. переводами на британский язык и сравнениями из французского, германского и испанского языков. Указатель главных британских переводов дается в конце словаря. Словарные статьи содержат толкования определений, иллюстрации их потребления и примеры. В приложении даны главные понятия теории стихосложения. Словарь предназначен для широких кругов филологов (педагогов, аспирантов, студентов, научных Словари лингвистических терминов. работников и др.).

Словарь новых слов. Словарь, в каком дается истолкование новых слов, не вошедших в изданные ранее словари. Таковой словарь-справочник “Новые слова и значения” вышел в 1971 г. под редакцией Н. 3. Котеловой и Ю. С. Сорокина. Словарь содержит около 3500 новых слов, выражений и значений слов, показавшихся в активном употреблении Словари лингвистических терминов. в повторяющейся печати и художественной литературе приемущественно в период 50—60-х годов XX века.

Бывают: одноязычные словари (с истолкованиями на российском языке), многоязычные словари (с истолкованием на российском языке), многоязычные словари (с истолкованиями на зарубежных языках), многоязычные словари (без истолкований).

Появление словарей этого типа относится к концу XIX в. Ранее Словари лингвистических терминов. лингвистическая терминология отражалась в более широких справочниках: энциклопедиях, толковых словарях общеупотребительного языка и т.п.

Расцвет лингвистической лексикографии относится к 60-м гг. XX в., что связано с возникновением новых лингвистических дисциплин, школ и направлений, представляющих новые определения.

Особенное место посреди словарей лингвистических определений занимает словарь О. С. Ахмановой (1966; 7 000 определений Словари лингвистических терминов.). Он представляет собой не только лишь обобщение всего предыдущего терминологического опыта, да и новый тип словаря, сочетающий сразу истолкование термина, перевод его на четыре языка, иллюстрации реального функционирования термина и схожее. Сравнение определений с определениями последующих языков: английским, французским, германским и испанским.

В качестве пособия для учителей средней школы издан «Словарь-справочник Словари лингвистических терминов. лингвистических терминов» Д. Э. Розенталя и М. А. Теленковой (М., 1975), в каком разъясняются определения лексики, фразеологии, фонетики, графики, орфографии, морфологии, синтаксиса, стилистики, пунктуации применительно к школьной практике.

Необходимо подчеркнуть еще ряд подобных изданий, приготовленных литературоведами и адресованных учителям и учащимся: «Словарь литературоведческих терминов» (ред.-сост., Л. И. Тимофеев Словари лингвистических терминов., С. В. Тураев. М., 1974); Л. Тимофеев, Н. Венгеров «Краткий словарь литературоведческих терминов» (под общ. ред. Л. И. Тимофеева. 4-е изд., испр. и доп. М., 1963); «Краткий словарь литературоведческих терминов» (ред.-сост. Л. И. Тимофеев, С. В. Тураев. М., 1978).

В этих книжках раскрываются главные понятия теории литературы, освещаются вопросы, связанные с Словари лингвистических терминов. осознанием самых различных явлений художественной литературы.

В словаре Э. Г. Азимова и А. Н. Щукина в более чем 2 000 статьях описана методическая терминология в области преподавания языков, родных и особых.

Англо-русский словарь по лингвистике и семиотике. Около 8000 определений. Под редакцией А.Н.Баранова и Д.О. Добровольского,Том Словари лингвистических терминов. II. 2-ой том «Англо-русского словаря по лингвистике и семиотике» содержит два указателя, которые упрощают использование первым томом, вышедшим отдельным изданием в 1996 г.

Русско-английский индекс позволяет отыскать по русскому термину его английские эквиваленты, фиксированные в первом томе. Отсюда следует, что его нельзя рассматривать как двуязычный русско-английский словарь лингвистической терминологии Словари лингвистических терминов.. Основная задачка индекса — вспомогательная. Читатель благодаря этому индексу может отыскать в первом томе словарные статьи, содержащие в качестве переводов
надлежащие российский лингвистические определения. Британский направленный на определенную тематику индекс дает возможность находить составной термин по его компонентам. К примеру, термин adverbial clause of result можно отыскать по всем его знаменательным Словари лингвистических терминов. компонентам: adverbial, clause, result. Необходимость такового индекса связана с тем, что в первом томе словаря принят строго алфавитный, а не гнездовой метод расположения словарных статей. Другими словами, все составные определения даются в словаре по алфавиту, начиная с первой буковкы первого слова.

19. Корпусная лингвистика, её идеология и главные понятия.

Корпусная лингвистика – раздел Словари лингвистических терминов. компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с внедрением компьютерных технологий.

Под заглавием лингвистический, либо языковой, корпус текстов понимается большой, представленный в электрическом виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, созданный для решения определенных лингвистических задач. Лингвистическим корпусом именуют совокупа текстов Словари лингвистических терминов., собранных в согласовании с определёнными принципами, размеченных по определённому эталону и обеспеченных спец поисковой машиной.

В понятие «корпус текстов» заходит также система управления текстовыми и лингвистическими данными, которую в ближайшее время в большинстве случаев именуют корпусным менеджером (либо корпус-менеджером) (англ. corpus manager). Это спец поисковая машина, включающая Словари лингвистических терминов. программные средства для поиска данных в корпусе, получения статистической инфы и предоставления результатов юзеру в комфортной форме.

Необходимость сотворения и смысл использования корпусов определяется последующими предпосылками:

1) довольно большой (репрезентативный) объем корпуса гарантирует типичность данных и обеспечивает полноту представления всего диапазона языковых явлений;

2) данные различного типа находятся в корпусе в Словари лингвистических терминов. собственной естественной контекстной форме, что делает возможность их всестороннего и беспристрастного исследования;

3) в один прекрасный момент сделанный и приготовленный массив данных может употребляться неоднократно, многими исследователями и в разных целях.

Можно сказать, что все современные лингвистические исследования и работы по составлению словарей и грамматик так либо по другому нацелены Словари лингвистических терминов. на внедрение презентабельных корпусов текстов. Развитие современных умственных программных систем, созданных для обработки текстов на естественном языке, также просит большой экспериментальной лингвистической базы. Спрос на корпусные данные совпал с возникновением соответственных технических способностей.

Термин введён в употребление в 60-х годах XX века в связи с развитием практики сотворения корпусов, которому начиная Словари лингвистических терминов. с 80-х содействовало развитие вычислительной техники.

В 1963 г. в Брауновском институте (США) в первый раз был сотворен большой корпус текстов на машинном носителе (Brown Corpus).

Потом последовали Ланкастерский корпус британского языка (Lancaster-Oslo-Bergen Corpus, LOB), Уппсальский корпус российского языка. Посреди современных корпусов британского языка более известны Английский государственный корпус Словари лингвистических терминов. (British National Corpus), Интернациональный корпус британского языка (International Corpus of English), лингвистический Банк британского языка (Bank of English), НКРЯ и др.

Объем первых корпусов составлял 1 млн словоупотреблений (Брауновский корпус, Уппсальский корпус российского языка). В текущее время считается, что объем общеязыкового корпуса должен быть не меньше 100 млн словоупотреблений.

Основная Словари лингвистических терминов. цель КЛ:

-лингвистическое описание языковой системы (подход от определенного исследования коммуникации людей),

-особый метод отражения речевого материала в корпусе текстов, который может употребляться в свою очередь другими лингвистическими дисциплинами.

Типы лингвистических корпусов - иллюстративные и исследовательские, статичные и динамические, одноязычные и полноязычные, корпусы устной либо письменной речи, национальные корпуса и др Словари лингвистических терминов..

Важное понятие корпусной лингвистики – репрезентативность. Под репрезентативностью понимается необходимо-достаточное и пропорциональное представление в корпусе текстов разных периодов, жанров, стилей, создателей и т.п. Репрезентативность - способность отражать все характеристики проблемной области.

Разметка (tagging, annotation)заключается в приписывании текстам и их компонентам особых меток (tag, tags): наружных, экстралингвистических (сведения об Словари лингвистических терминов. создателе и сведения о тексте: создатель, заглавие, год и место издания, жанр, тема; сведения об создателе могут включать не только лишь его имя, но также возраст, пол, годы жизни и почти все другое. Это кодирование инфы имеет заглавие метаразметка), структурных (глава, абзац, предложение, словоформа) и фактически лингвистических, описывающих лексические Словари лингвистических терминов., грамматические и остальные свойства частей текста.

Посреди лингвистических типов разметки выделяются:

· морфологическая разметка.

морфологические метки включают не только лишь признак части речи, да и признаки грамматических категорий, характерных данной части речи.

· Это основной тип разметки: во-1-х, большая часть больших корпусов являются как раз морфологически размеченными корпусами, во-2-х, морфологический анализ рассматривается Словари лингвистических терминов. как база для последующих форм анализа – синтаксического и семантического, и, в-3-х, успехи в компьютерной морфологии позволяют автоматом размечать корпусы огромных размеров;

· синтаксическая разметка, являющаяся результатом синтаксического анализа, либо парсинга (англ. parsing), выполняемого на базе данных морфологического анализа. Этот вид разметки обрисовывает синтаксические связи меж лексическими единицами и разные Словари лингвистических терминов. синтаксические конструкции (к примеру, придаточное предложение, глагольное словосочетание и т.п.);

· семантическая разметка. Хотя для семантики нет единой семантической теории, в большинстве случаев семантические тэги обозначают семантические категории, к которым относится данное слово либо словосочетание, и поболее узенькие подкатегории, специфицирующие его значение;

· анафорическая разметка. Фиксирует референтные Словари лингвистических терминов. связи, к примеру, местоименные;

· просодическая разметка. В просодических корпусах используются метки, описывающие ударение и интонацию. В корпусах устной разговорной речи просодическая разметка нередко сопровождается так именуемой дискурсной разметкой, которая служит для обозначения пауз, повторов, оговорок, и т.д.

Есть и другие типы разметки.

Работа юзеров с корпусом осуществляется при Словари лингвистических терминов. помощи специализированных программных средств – корпусных менеджеров, предоставляющих различные способности по получению из корпуса нужной инфы:

- поиск определенных словоформ;

- поиск словоформ по леммам;

- поиск группы словоформ в виде разрывной либо неразрывной синтагмы;

- поиск словоформ по набору морфологических признаков;

- отображение инфы о происхождении, типе текста и т.п.;

- вывод поисковых результатов с указанием контекста Словари лингвистических терминов. данной длины;

- получение разных лексико-грамматических статистических данных;

- сохранение отобранных строк конкорданса в отдельном файле на компьютере юзера и др.

Поисковые результаты обычно выдаются в виде конкорданса (потому корпусные менеджеры еще именуют конкордансерами), где разыскиваемая единица представлена в ее контекстном окружении и в виде статистических данных. Последние могут фиксировать частотные Словари лингвистических терминов. свойства отдельных языковых единиц, либо граммем, либо могут охарактеризовывать совместную встречаемость нескольких лексических единиц. Многие системы позволяют настраивать формат выдачи (поменять длину левого и правого контекста, задавать объем выдачи и порядок сортировки данных, показывать либо не показывать лингвистические и экстралингвистические свойства, и т.д.).

Невзирая на Словари лингвистических терминов. обилие корпусов, можно выделить два главных метода деления корпусов на классы: 1) это противопоставление корпусов, относящихся ко всему языку (нередко к языку определенного периода), корпусам, относящимся к какому-либо подъязыку (жанр, стиль, язык определенной возрастной либо социальной группы, язык писателя либо ученого и т.п.); 2) разделение корпусов по типу лингвистической Словари лингвистических терминов. разметки. Невзирая на наличие огромного количества типов разметки, большая часть реально имеющихся корпусов относится к корпусам морфологического или синтаксического типа (последние в английской литературе именуют treebanks, что можно перевести как «банки синтаксических структур»). При всем этом следует выделить, что корпус с синтаксической разметкой очевидно либо неявно содержит в себе и морфологические свойства Словари лингвистических терминов. лексических единиц.

Признак Типы корпусов
Тип данных Письменные Речевые Смешанные
Язык текстов Российский Британский и т.д.
«Параллельность» Одноязычные Двуязычные Многоязычные
«Литературность», специфика Литературные Диалектные Разговорные Терминологические Смешанные
Жанр Литературные Фольклорные Драматургические Публицистические
Доступность Свободно доступные Коммерческие Закрытые
Предназначение Исследовательские Иллюстративные
Динамичность Динамические (мониторные) Статические
Разметка Размеченные Неразмеченные Словари лингвистических терминов.
Нрав разметки Морфологические Синтаксические Семантические Просодические и т.д.
Объем текстов Полнотекстовые «Фрагментнотекстовые»
Хронологический нюанс Синхронические Диахронические
«Общность» Общие 1-го писателя
Структура Центральные и архивные Ядерные и периферийные

Главные понятия.

Проблемная область. Под проблемной областью понимается область реализаций языковой системы, содержащая феномены, подлежащие лин­гвистическому описанию. Проблемная область для определенного корпуса Словари лингвистических терминов. данных может быть сколь угодно велика либо мала — все определяется избранным объектом анализа. Значительно подразумевать, что в эталоне проблемная область имеет два измерения — языковое и речевое. Рече­вое представлено речевыми высказываниями (реализациями), а языковое измерение проявляется в существовании возможной способности по­явления других употреблений, дополняющих массив Словари лингвистических терминов. имеющихся реализа­ций. Обычно, в корпусной лингвистике языковой нюанс практически игнорируется, так как вначале фиксируется область привлекаемых данных — реализаций языковой системы. Это совсем естественно, так как навряд ли может быть зафиксировать, собрать «потенцию», «воз­можность». Но для часто изменяемых корпусов данных языковой нюанс проблемной области сходу «вылезает» при разработке принципов модификации Словари лингвистических терминов. корпуса. Не считая того, для лингвистического исследования (не считая специально оговариваемых случаев) в центре внимания стоит конкретно языковое измерение, так как его следует реконструировать в итоге анализа.

С чисто практической точки зрения проблемная область в большинстве случаев стает перед разработчиком корпуса как огромное количество данных, обработка которых затруднена Словари лингвистических терминов. из-за того, что языковых реализаций очень много.

Корпус данных. Корпус данных представляет собой сформированную по определенным правилам подборку данных из проблемной области. Тем корпус данных представляет собой итог отображения из про­блемной области. В отличие от проблемной области, корпус данных имеет только одно измерение — речевое, так как сам по Словари лингвистических терминов. для себя он не обла­дает потенцией производства собственных составляющих. Последнее, но, не значит, что корпус данных не может употребляться для реконструк­ции языка как системы. Напротив — это одна из основных задач лингви­стического исследования корпуса. Пред нами одно из глобальных про­тиворечий, характерное хоть какому продукту языковой системы Словари лингвистических терминов. — от звука до текста. Языковеду приходится по отдельным результатам деятельности языка делать выводы о функционировании языка как целого, как системы.

Единица хранения корпуса данных. Так как корпус данных — это некая подборка из проблемной области, сформированная по опре­деленным принципам, то единица хранения конкретно находится в зависимости от того, по каким Словари лингвистических терминов. основаниям осуществляется подборка. Единица хра­нения — это некая совокупа естественноязыковых выражений проблемной области, которой сопоставляется одно описание на не­котором метаязыке, определяемом процедурой формирования корпуса. У. Фрэнсис, обсуждая размеры «базовых единиц» корпуса, отмечает, что это могут быть отдельные слова, недлинные фразы, предложения, слово­сочетания (синтагмы). Если корпус подразумевается для синтаксического Словари лингвистических терминов. анализа, то он должен включать целые тексты либо их довольно огромные куски [Фрэнсис 1983, с. 344 и далее].

На основании описания единицы хранения можно судить о том, какая часть проблемной области представлена в корпусе. К примеру, еди­ница хранения корпуса маркетинговых слоганов, сделанного в Отделе экспе­риментальной лексикографии Института российского языка РАН Словари лингвистических терминов., включает последующие свойства:

• слоган: Для парней, которые обожают дам, которые обожают парней

• компания: «Louis Azzaro»

• предмет: туалетная вода Azzaro pour Homme

• область: косметика и парфюмерия

• вид слогана: перевод с французского

• оригинал: Pour les hommes qui aiment les femmes qui aiment les hommes

• источник: Стае, Космополитен

Выражение естественного языка Для парней, которые обожают дам, которые Словари лингвистических терминов. обожают парней и сопоставленные ему свойства совместно образуют единицу хранения, которая может вводиться в базу данных либо врубаться в обыденный файл текстового формата.

Единица хранения корпуса заглавий газетных статей должна бы­ла бы включать само заглавие и совокупа дескрипций, содержащих информацию о том, из какой газеты заглавие получено Словари лингвистических терминов., в какой рубрике находится статья, когда вышла газета и другую нужную инфор­мацию. Совокупа описаний единиц хранения образует некое огромное количество, по которому можно судить о представительности подборки — какие газеты представлены, как формировалась подборка по временному параметру (все газеты какого-то периода vs. газеты через определен­ные промежутки времени vs Словари лингвистических терминов.. все газеты избранных временных отрезков и т.д.); статьи каких рубрик представлены и пр.

Корпус текстов. Корпус текстов — это вид корпуса данных, единица­ми которого являются тексты либо их довольно значимые фрагмен­ты, включающие, к примеру, какие-то полные куски макроструктуры текстов данной проблемной области.

Несколько суждений о типах Словари лингвистических терминов. корпусов данных.

Исследовательские корпусы. Исследовательскими именуются такие корпусы, которые предусмотрены в большей степени для исследования раз­личных качеств функционирования языковой системы. Они строятся не post factum — после проведения какого-нибудь исследования, а до его проведения. Этот тип корпусов данных, обычно, нацелен на широкий класс лингвистических задач. Неспецифицированность за­дачи просит при построении исследовательских Словари лингвистических терминов. корпусов использовать пропорциональное сужение, являющееся более обычным методом обеспечения репрезентативности (см. ниже).

Иллюстративные корпусы. Иллюстративные корпусы создаются после проведения научного исследования: их цель не столько выявить новые факты, сколько подтвердить и доказать уже приобретенные результаты. Такие корпусы не являются слепком, правильным (исходя из убеждений стати­стики) отображением Словари лингвистических терминов. проблемной области. Они включают только то, что довольно для иллюстрации описываемого парадокса. Обычный пример иллюстративного корпуса представлен в «Путеводителе по дискурсив­ным словам российского языка» [Баранов, Плунгян, Рахилина 1993], где семантический анализ частиц и выделенные значения сопровождаются значимым текстовым материалом, позволяющим читателю проверить предложенные семантические интерпретации.

Динамические и статические корпусы Словари лингвистических терминов. текстов. Сначало корпусы текстов создавались как статические образования, отражающие опреде­ленное временное состояние языковой системы. Обычными представи­телями этого вида корпусов являются авторские корпусы — коллекции текстов писателей. Но значимая часть чисто лингвистических и не только лишь лингвистических задач просит выявления функционирования языковых феноменов на временной шкале — к примеру, конфигурации значе­ния слов, частоты Словари лингвистических терминов. использования тех либо других синтаксических конструк­ций и пр. Для отражения процессуального нюанса проблемной области была разработана новенькая разработка построения и эксплуатации динами­ческого корпуса текстов. В имеющейся литературе такие корпусы получи­ли также заглавие мониторных23). Особенность сборки мониторных кор­пусов состоит в том, что они не подразумевают Словари лингвистических терминов. раз и навечно заданно­го набора текстов. В течение заблаговременно фиксированного промежутка време­ни происходит обновление и/либо дополнение огромного количества текстов корпуса.

Специфичность эксплуатации динамического корпуса заключается в том, что юзер при проведении исследования может выделить из об­щего генерального корпуса рабочий корпус, включающий только часть текстов генерального корпуса Словари лингвистических терминов.. Как динамический корпус строился Бир­мингемский корпус британского языка. Пример динамического корпуса по современной русской публицистике рассматривается ниже.

Корпусы параллельных текстов. Для научных и практических це­лей (а именно, для преподавания зарубежных языков) формируются

23) Термин «мониторный» прямо связан с мыслью лингвистического мониторинга — см. §4 главы 5.

корпусы параллельных текстов. По собственной Словари лингвистических терминов. структуре это подмножество текстов на языке-источнике и одно либо несколько подмножеств текстов, которые являются переводами текстов языка-источника на языки-цели. К примеру, британский текст «Alice in Wonderland» и его переводы на не­мецкий, французский и российский языки могут сформировывать таковой корпус либо быть частью большего корпуса параллельных Словари лингвистических терминов. текстов.

Метод представления и хранения корпуса данных. Больший инте­рес представляют те методы, которые опираются на современные ком­пьютерные технологии хранения и обработки данных. Для предстоящего изложения принципиально делать различие меж 2-мя основными методами представления — неструктурированным текстовым форматом хранения (запись графем текста в ASCI-кодах) и структурированным форматом хра­нения (текст Словари лингвистических терминов. со специальной разметкой); к последнему можно отнести также представление данных в форматах баз данных разного типа.

Порог отображения. Так как корпус данных является сужением проблемной области, то совсем разумеется, что при «пропорциональ­ном» сужении, являющемся, по-видимому, простым случаем реализа­ции принципа репрезентативности (см. ниже), некие части проблем­ной области оказываются Словари лингвистических терминов. вне корпуса данных. Возьмем твердый пример. Пусть в проблемной области содержится 20 контекстов, а в корпусе дан­ных должна быть 4-ая часть — 5 контекстов. Контексты являются примерами реализации разных синтаксических феноменов: в 10 контекстах представлены обыкновенные предложения, а в восьми — сложные. В 2-ух последних контекстах содержатся примеры парцелляции. В корпу­се данных Словари лингвистических терминов. один контекст соответствует четырем контекстам проблемной области. Это значит, что контексты парцелляции при пропорциональ­ном сужении вчетверо не попадают в корпус данных. Соотношение меж корпусом данных и проблемной областью при пропорциональ­ном сужении будем именовать порогом отображения. Чем выше порог, тем больше возможность, что какие-то феномены проблемной области, владеющие сравнимо низкой Словари лингвистических терминов. частотой, не попадут в корпус данных.

Параметризация проблемной области. Сужение проблемной области к исследовательскому корпусу основывается на выделении неких ха­рактеристик текстов проблемной области, которые релевантны для пред­полагаемого исследования. Совокупа этих черт (их возмож­ные композиции) образует многомерную матрицу, служащую основой для отбора текстов в корпус. Нередко для Словари лингвистических терминов. оценки релевантных характеристик про­блемной области привлекается экспертная оценка. У. Фрэнсис, описывая историю сотворения Брауновского корпуса, отмечает, что на шаге плани­рования работ было собрано совещание узнаваемых профессионалов в области конструирования корпусов (в нем учавствовали Р. Куирк, Ф. Гоув, Дж. Кэррол), которое и определило главные принципы параме Словари лингвистических терминов.­тризации проблемной сферы и структуру корпуса


slovoobrazovatelnij-slovar.html
slovosochetanie-i-predlozhenie.html
slovosochetanie-tipi-slovosochetanij.html