Аннотация:Статья посвящена способам отбора и анализа идиом находящегося в процессе подготовки к печати нового лексикографического продукта «Современная немецкая фразеология: Немецко-русский корпусный словарь». Ранее лексикографы при отборе словника в основном ориентировались на собственную интуицию, обращаясь иногда к таким традиционным методам сбора эмпирических данных как опросы и включенное наблюдение. С широким распространением электронных корпусов появился дополнительный инструмент для проверки употребительности языковых единиц и анализа их речевого употребления. Для получения адекватных результатов при работе с корпусом важно, в частности, определить, в какой степени целесообразно использовать параллельный корпус, а если он оказывается нерепрезентативен, какие одноязычные корпусы в наибольшей степени подходят как источник материала и лексикографически значимых сведений для конкретного типа словаря. Центральный вопрос при работе с корпусом заключается в следующем: что именно ожидает лексикограф от привлечения корпусных данных; какие сведения об особенностях структуры и функционирования описываемых выражений, которые невозможно получить никаким другим путем, должен дать корпус?
В статье показано, как обращение к корпусу позволяет систематизировать по значимым для фразеологического словаря критериям отбор идиом для словника, уточнить семантическую структуру описываемого выражения, в том числе, выявить многозначность и исследовать особенности его межъязыковой эквивалентности.
The article discusses methods of data selection and analysis in the new lexicographical project 'Modern German Phraseology: German-Russian Corpus Dictionary', currently being prepared for public release. Previously, when choosing lexical entries for a dictionary, lexicographers were guided mainly by their own intuition, occasionally resorting to traditional methods of empirical data collection such as surveys and observation of the native speakers’ discourse. With the widespread availability of electronic corpora, an additional method has emerged which facilitates assessment and analysis of linguistic units in use. To achieve adequate results when working with a corpus, it is crucial to decide to what extent it is advisable to use a parallel corpus. If it is not representative, we have to identify monolingual corpora that are most suitable as a source of data and lexicographically significant information for a given type of dictionary. The central question is: what exactly does the lexicographer expect from utilizing corpus data; what information about the structure and functioning of the described expressions, which cannot be obtained by any other means, should the corpus provide?
The article shows how addressing the corpus allows the systematic selection of idioms based on criteria significant for the phraseological dictionary, a thorough analysis of the semantic structure of a given expression, including its polysemy and cross-linguistic equivalence.