Обсуждение Викисловаря:Лексикографическая концепция

Материал из Викисловаря
Перейти к: навигация, поиск

А слабо поставить интервики? Т.е. известны ли Викисловари, кроме Русского, где люди уже попытались сформулировать концепцию Словаря? -- AKA MBG 20:27, 2 декабря 2008 (UTC)

Я не нашел, и судя по тому, как все они работают, никто об этом особенно не задумывается. Конечно, все пытаются как-то регламентировать структуру статьи и принципы отбора и описания материала, но делается это без идеологической платформы. Мы одни тут такие концептуальные (пока что). --Al Silonov 22:09, 2 декабря 2008 (UTC)

Веша, давай будет менее агрессивный шаблончик, типа как здесь: Викисловарь:Правила оформления статей. -- Andrew Krizhanovsky 20:21, 25 марта 2009 (UTC)

Спасибо. Про "машинночитаемую базу" - это хорошее уточнение (например, сейчас зуб-поговорки - удобны для читателя, но парсер их не съест, ибо не укладывается в текущую структуру статьи). -- Andrew Krizhanovsky 07:29, 26 марта 2009 (UTC)
  • "Лингвисты выделяют в языке следующие структурные уровни: фонетический (звучание), орфографический (правильное написание), морфологический (состав слов), синтаксический (взаимодействие между словами в речи, тексте), семантический (значение, смысл), этимологический (происхождение слов и выражений). Все эти уровни должны находить по возможности полноценное отражение в каждой статье словаря" - что-то не пойму, мы набор символов классифицируем (в виде дерева категорий) или что-то другое? Если набор символов, то должен быть только 1 уровень (семантический, классификация/интерпретация набора символов), остальные - его подуровни (или в остальных способах классификации набора символов значения, смысла нет?). Любая категория (набор символов) однозначно задаётся (классифицируется, приобретает смысл, значение) совокупностью своих подкатегорий и надкатегорий (семантикой). Fractaler (обсуждение) 07:54, 25 октября 2012 (UTC)
На это нечего ответить, тут в каждой синтагме - признаки каши в голове, извиняюсь. (В математике выделяют геометрию, арифметику, алгебру, теорию чисел и т. п. Это что - набор символов?) --Al Silonov (обсуждение) 10:18, 25 октября 2012 (UTC)
Берём 6 элементов некоего множества, каждый из которых состоит из совокупности символов 1) "математика", 2) "геометрия", 3) "арифметика", 4) "алгебра", 5) "теорию чисел". Пытаемся комбинировать элементы, пока не появляется "некий смысл" (связываем их между собой, например, для наглядности, в виде дерева категорий):
Дерево категорий (граф):

. У нас получилась некая комбинация элементов, которой мы придаём некий смысл. Но ведь мы могли использовать вместе с первым набором символов ("математика") другие наборы символов (например, "слова из 10 букв"):

Дерево категорий (граф):

. Разве здесь дерево категорий уже не будет иметь смысла? Смысл - это просто связи между категориями (вершинами графа). Если вершина графа получает другое наименование (набор символов, идентификатор), смысл не исчезает, а меняется. Fractaler (обсуждение) 17:32, 25 октября 2012 (UTC)

  • Поэтому, Википедии - википедиево (смысловое дерево категорий, т.е., чёрт его знает где брать првила построения ), викисловарю - викисловарёво - (дерево категорий по своим, языковым правилам, т.е., всё чётко и однозначно) Fractaler (обсуждение) 14:45, 2 ноября 2012 (UTC)

Приоритет[править]

"При составлении Викисловаря в качестве основных источников используются данные предшествующих словарей и корпусы реальных текстов. Наличие того или иного слова в том или ином языке должно подтверждаться хотя бы одним из таких источников (то есть слово должно либо присутствовать в одном или нескольких авторитетных словарях, либо более или менее регулярно встречаться в текстовых корпусах). При наличии разногласий относительно каких-либо описываемых свойств какой-либо языковой единицы приоритет (с точки зрения доказательности) отдаётся корпусным источникам." - правильно ли я понимаю, что из этого следует, что в викисловаре при определении свойств слова приоритет отдаётся тому, что встречается в текстах, находящихся в корпусах и которые могут содержать ошибки, а не тому, что по поводу этого слова пишут словари? Dinamik (обсуждение) 08:59, 23 марта 2013 (UTC)

На чём основана уверенность, что словари не содержат ошибок?
Средний по объёму корпус содержит на порядки большее число разных слов, чем их описывает большой-пребольшой словарь. Во-вторых, для словарей проблема актуальности и устаревания стоит, я полагаю, более остро, чем для корпусов. -- Andrew Krizhanovsky (обсуждение) 17:22, 23 марта 2013 (UTC)
Словари могут содержать ошибки, но, думаю, их число на порядок меньше ошибок, которые люди допускают в повседневной речи по причине плохого знания предмета. Соответственно, какой-нибудь технический термин практически наверняка лучше описан в специализированном словаре, нередко люди используют в своей речи профессиональные термины просто потому, что они красиво звучат. Такое использование приводит как к банальным орфографическим ошибкам, так и к смысловым (термин используется неверно).
Одно дело опираться на корпус, когда описания слова в словарях нет (не до жиру, быть бы живу), другое - отдавать приоритет бытовой речи при наличии нормального описания предмета в специализированной литературе. Dinamik (обсуждение) 21:29, 23 марта 2013 (UTC)
В основном корпусе, на который опирается Русский Викисловарь, т.е. в w:НКРЯ, техническая литература тоже представлена. Авторы корпуса в своих публикациях среди целей, к которым они стремятся при разработке корпуса, указывают на "сбалансированность" корпуса по тематикам. Т.е. технические термины в профессиональном употреблении в корпусе существуют. Там есть много учебников и спец. литературы.
Главное при поиске в корпусе - правильно задать параметры и область поиска. У НКРЯ довольно богатый поисковый интерфейс. -- Andrew Krizhanovsky (обсуждение) 08:54, 24 марта 2013 (UTC)
Насколько можно понять, НКРЯ включает в себя, в основном художественные тексты и газетные статьи. Я не могу говорить, что технических словарей в НКРЯ нет, но, попробовав вбить в поиск несколько железнодорожных и строительных терминов, я не получил ни одного результата из технической литературы, были выданы результаты лишь из художественной литературы и неспециальных периодических изданий.
Положим, есть технический термин, к которому имеются описания из: а) специальной технической литературы, энциклопедических источников и/или словарей; б) НКРЯ; в) того, что можно найти в интернете. При этом описание а) более узкое и чёткое, чем б) и в), в б) и в) встречается некорректное использование термина по причине недостаточной подготовки в соответствующей области, в НКРЯ технической литературы по данному термину нет. Существует мнение, что в этом случае в качестве значения слова в соответствии с Викисловарь:Лексикографическая концепция следует приводить то, что следует из текстов, встречающихся в б) и в), а не то, что записано в а) - верно ли это мнение?
Если не секрет - какие термины? Т.е. хорошо бы разобрать вопрос на конкретном примере, а не абстрактно. -- Andrew Krizhanovsky (обсуждение) 17:07, 25 марта 2013 (UTC)

Для кого Викисловарь?[править]

Где определяется целевая аудитория Викисловаря? Или лексикографическая концепция - сама по себе, а те, для кого она - сами по себе? --Fractaler (обсуждение) 06:22, 24 февраля 2015 (UTC)