Обсуждение Викисловаря:Критерии включения в словарь

Содержимое страницы недоступно на других языках.
Материал из Викисловаря

ЗАТО[править]

А как быть с городами типа Челябинск-40, Томск-7, Красноярск-26, Сальск-7. ИМХО, не стоит их включать в ВС. --- Валентин 17:15, 18 января 2021 (UTC)[ответить]

Дополнил отрицательный критерий «буквенно-цифровые обозначения объектов и мест». Don Rumata 17:25, 18 января 2021 (UTC)[ответить]

Комментарии и предложения. Г. Мейстер[править]

  1. Название правила нужно изменить: не слова, а языковой единицы.
  2. Не хватает преамбулы.
  3. В пункте Принцип семантической ценности нужно сказать о диалектизмах.
  4. Что с единицами из словарей диалектной личности?
  5. Думаю, в пункте Принцип словообразовательной ценности нужно сказать и об унификсах.
  6. Почему не выделяете фраз. сочетания?
  7. Про онимы можно добавить довольно большой объём информации.

P. S. Необходимо также исправить пунктуационные ошибки. — Герман Мейстер (обс.) 20:02, 18 января 2021 (UTC)[ответить]

Герман Мейстер, можно «Критерии включения лексические единицы» (как в ВС:ЛК) или «Критерии включения в словарь». По поводу остального, я был бы признателен, если бы вы привели здесь предлагаемый текст преамбулы и других пунктов дополнений. Пунктуационные ошибки правьте смело. Don Rumata 11:39, 9 мая 2021 (UTC)[ответить]
Лучше «Критерии включения лексических единиц», чтобы все было учтено. treskful 16:15, 25 августа 2021 (UTC)[ответить]
В Викисловарь включаются не только лексические единицы. — Герман Мейстер (обс.) 16:23, 25 августа 2021 (UTC)[ответить]
Определение лексической единицы здесь неверное? Хорошо, в таком случае языковые единицы, действительно, более широкое понятие. treskful 20:29, 25 августа 2021 (UTC)[ответить]

«понятия и явления наивной языковой картины мира»? --Bookvaedina (обсуждение) 20:23, 7 февраля 2021 (UTC)[ответить]

Научная картина мира — концептуальная, а языковая картина мира – наивная. См. Языковая картина мира: основные признаки, типология и функции Don Rumata 10:51, 9 мая 2021 (UTC)[ответить]
Если языковая картина мира и так наивная, то получается плеоназм. Предлагаю определение убрать (тоже на нем споткнулся при чтении). treskful 16:16, 25 августа 2021 (UTC) UPD. treskful 11:18, 26 августа 2021 (UTC)[ответить]

Комментарии и предложения от МаксаОттоФонШтирлица[править]

  1. Строку о мифологических и религиозных персонажах предлагаю переформулировать так: имена богов и божеств любого пантеона (Аллах, Стрибог, Зевс, Виракоча), персонажей мифов и легенд любого народа (Талия, Академ), а также персонажей священных книг всех традиционных религий и наиболее распространённых новых религиозных движений (Яхве, Христос, Хава, Мормон, Мороний). Дабы включались не только библейские персонажи, но и коранические, и буддистские, и мормонские.
  2. Как быть с составными словами, в которых одна часть пишется латиницей, а вторая - кириллицей? Например, COVID-диссидент, SMM-специалист
  3. Насчет псевдонимов - мне кажется, что стоит включать только псевдонимы, заменившие известному человеку фамилию (Горький, Ленин, Сталин) или слившиеся с ней(Салтыков-Щедрин). Для всех остальных лучше создать Приложение:Псевдонимы известных людей

--MaksOttoVonStirlitz (обсуждение) 05:14, 8 февраля 2021 (UTC)[ответить]

  1. Добавил.
  2. Это еще необрусевшие варианты написания. Не вижу с этим проблем.
  3. Псевдонимы — очень важная часть ономастики. Существуют словари, например Словарь псевдонимов русских писателей, ученых и общественных деятелей: В 4 т. / Всесоюз. кн. палата; Подгот. к печати Ю. И. Масанов; Ред. Б. П. Козьмин.. — М. : Изд-во Всесоюз. кн. палаты, 1956—1960. Четыре тома трудно в приложение уместить. Don Rumata 11:20, 9 мая 2021 (UTC)[ответить]
    Вопрос про псевдонимы не такой уж и простой. Если взять словарь Масанова, то там мы увидим не только простые варианты вроде Ленин, но и -въ, Moi même, Человек без селезёнки, Евгений Тарусский, а также более экзотические Δ, 16/2, *** из Константинополя, , —е— и т. п.. Как с ними быть? Как с ними (даже самыми простыми случаями вроде Евгений Тарусский) быть и с помощью каких морфологических шаблонов их описывать?
    Их точно все нужно включать или это все-таки удел специальных словарей? Или нужны ограничения как промежуточный вариант? Например, как минимум прописать здесь, что в конкретный языковой раздел могут входить только лексические единицы в характерной для этого языка системе письменности (то есть для русского раздела не годятся записанные латиницей единицы вроде TV, несмотря на то что в русских текстах они употребляются). Такое правило вообще где-то есть? treskful 16:34, 25 августа 2021 (UTC)[ответить]

«Включение каждого не представляется возможным.»[править]

Почему это «не представляется возможным»? Мы явно говорим ровно противоположное: ВС:НЕБУМАГА. Но в то же время ВС:НЕВЫДУМКА. — Wesha (обсуждение) 07:46, 6 мая 2021 (UTC)[ответить]

Убрал. Don Rumata 11:49, 9 мая 2021 (UTC)[ответить]

Названия мероприятий - форумов, фестивалей и.т.п.[править]

DonRumata, как вы считаете, стоит ли включать в словарь упомянутые названия (к примеру, созданную Германом статью о Петербургском международном экономическом форуме)? Если да, то по каким критериям? Имхо, если и включать — то только форумы мирового уровня, наподобие Давосского форума или Альянса цивилизаций.

И второй вопрос. Не пора ли страницу переносить в основное пространство? Имхо, давно пора — правило обсуждалось несколько месяцев, все оставленные коллегами комментарии были учтены. --MaksOttoVonStirlitz (обсуждение) 15:01, 4 июня 2021 (UTC)[ответить]

@MaksOttoVonStirlitz, вы неправы: о правиле знают далеко не все активные участники. (К тому же не все комментарии были учтены.)
Мнение @DonRumata не столь важно. Важно, ссылаясь на работы учёных-лексикографов, вносить предложения. — Герман Мейстер (обс.) 15:12, 4 июня 2021 (UTC)[ответить]
Это противоречит ВС:ЧНЯВ. Разница между словарем и энциклопедией, в том, что и как они описывают. Всё, что перечислено выше не имеет никакого отношения к лексикографии. Don Rumata 18:04, 4 июня 2021 (UTC)[ответить]

Отрицательные критерии[править]

Предлагаю не включать малоупотребляемые (либо широкоупотребляемые в узком кругу) названия лекарств и БАДов. Оставить только широкоиспользуемые названия лекарств типа анальгин, цитрамон, валидол и прочее. --- Валентин 19:04, 4 июня 2021 (UTC)[ответить]

Тут «принцип частотности» общего критерия работает. Никогда не знаешь какое лекарство станет супер популярным. Don Rumata 13:37, 15 августа 2021 (UTC)[ответить]
Кто и по каким критериям будет оценивать частотность употребления? Мне кажется, о названиях лекарств должен быть консенсус и отдельный пункт в критериях.
@Vesailok, какие малоупотребительные названия Вы имели в виду? Как, с Вашей точки зрения, можно отграничить их от широкоупотребимых? treskful 16:42, 25 августа 2021 (UTC)[ответить]

Сейчас у нас описаны некоторые эрративы, хотя не все категоризованы, см. [[Категория:Эрративы/ru]]. Значит, всё-таки некоторые могут быть включены в ВС? И, напр., омериканец? --Bookvaedina (обсуждение) 06:55, 14 августа 2021 (UTC)[ответить]

В основном пространстве им точно не место, т.к. это просто безграмотно. Но в приложениях пусть будут. См. Приложение:Словарь падонкаф. Don Rumata 13:34, 15 августа 2021 (UTC)[ответить]
Кстати, «неблагозвучные» слова часто заменяются эрративами. Тут могут быть исключения. Don Rumata 14:01, 15 августа 2021 (UTC)[ответить]
Можете ли вы привести примеры таких эрративов? Чем они отличаются от эвфемизмов (не являются ли частным их случаем)? Помета эррат. допустима?
Если в приложениях эрративы допустимы, то нужна система этих приложений или одно Приложение:Эрративы/ru, например, с четкой систематизацией?
P. S. Сейчас на ВС кроме страниц эрративов вроде йуный аффтар или Фашингтон есть даже разделы «Эрративы» и «Устойчивые эрративы». treskful 16:58, 25 августа 2021 (UTC)[ответить]

двойные фамилии, которые через дефис[править]

Как мы описываем двойные фамилии типа Салтыков-Щедрин, Всеволодский-Гернгросс и подобные? --Bookvaedina (обсуждение) 13:09, 14 августа 2021 (UTC)[ответить]

Обязательно нужно вносить. У них, как правило, интересная этимология. Двойные фамилии есть не только в русском, но и польском, украинском, английском, немецком и т.д. Don Rumata 13:53, 15 августа 2021 (UTC)[ответить]
Может, добавить в качестве примера в критерии одну двойную фамилию, чтобы о них не возникало вопросов? treskful 17:02, 25 августа 2021 (UTC)[ответить]

Слова-фантомы[править]

Я считаю, не должно быть полноценных статей (разве что перенаправления на приложение) о словах-фантомах. Нужно указать это в правиле и, вероятно, изменить фразу «Однозначно включается в словарь зафиксированная в печатных словарях... терминология». Cinemantique (обсуждение) 14:44, 14 августа 2021 (UTC)[ответить]

Согласен. На практике мы их уже удаляем. Don Rumata 14:04, 15 августа 2021 (UTC)[ответить]
Это довольно субъективный критерий. Никто не знал слово бебра (стало известно благодаря одному видео), мимими (из мультфильма Мадагаскар), ковид (в связи с коронавирусной пандемией) (я надеюсь, упоминая этот термин бебра , не нарушаю правило w:ВП:ЭП). Блинов Рюрик Петрович (обсуждение + вклад) 20:23, 12 ноября 2021 (UTC)[ответить]
Критерий в том, что нет примеров употребления. Что тут субъективного? Cinemantique (обсуждение) 05:08, 13 ноября 2021 (UTC)[ответить]

Комментарии от Treskful[править]

Возможно, это не вполне впишется в принятый здесь формат обсуждения, но зафиксирую свои мысли, возникшие при прочтении предлагаемых критериев. Надеюсь, они окажутся полезными.

  1. Довольно трудно осознать, для кого написан этот текст. Будучи филологом (пусть и литературоведом), я понял смысл далеко не всех выражений. Чего можно ожидать от других редакторов разного уровня подготовки, задумывающихся о том, стоит ли создавать страницу для языковой единицы, которой нет в ВС? Понимаю, что есть Требуемые статьи, но все же, мне кажется, сто́ит и при написании правил рассчитывать на непонятливого. Приведу примеры.
    • «Принцип строевой способности (подчеркивающий ведущую роль строевых элементов языка для высказывания и смыслового восприятия)» — если бы далее не были перечислены части речи, я бы точно не понял, о чем идет речь. По-моему, можно просто написать «является одной из служебных частей речи, связывающих слова в предложении (предлоги, артикли, союзы, вспомогательные глаголы, модальные слова, частицы и т. д.)».
    • «При включении в словарь потенциальных лексем ограниченной сферы употребления (областные слова, термины, экзотизмы, авторская неология и т. п.) в первую очередь следует учитывать следующие факторы: системность (типичность словообразовательной модели, аналогия) и потенциальность словообразования (гнездование), экстралингвистический фактор номинации (актуальность, историко-культурный фон)». Тут я, извините, не понял ничего.. Как учитывать эти факторы? Что такое системность = типичность словообразовательной модели, аналогия или «экстралингвистический фактор номинации (актуальность, историко-культурный фон)»? Как оценить актуальность и историко-культурный фон? Самая туманная часть критериев для меня. На мой взгляд, подобные формулировки спровоцируют большое количество конфликтов, потому что критерии нужны в том числе для того, чтобы апеллировать к ним в случае отмены правок.
    • «…создавать предпосылки для лексической догадки и самостоятельной семантизации» — что это значит? Кстати, если слово является одиночным (от него не образуются другие), то оно, получается, не имеет словообразовательной ценности, а значит, если и пройдет, то по другому «принципу»?
    • «Рассматривая возможность создания статьи, <…> следует придерживаться следующих принципов» — это как? Кажется, формулировка неудачна. Предлагаю написать так: Включаемые языковые единицы должны: 1) обладать семантической ценностью [общеупотребительные/редкоупотребительные]; 2) обладать словообразовательной ценностью [слова и аффиксы/символы] и т. д. Впрочем, кажется, это отчасти пересекающиеся, а отчасти исключающие друг друга критерии. Так, например, не могу придумать ни одной языковой единицы (кроме включенных в ВС букв), которая не обладала бы семантической ценностью.
  2. В преамбуле утверждается, что «предметом описания в Викисловаре являются все лексические единицы, зафиксированные во всех письменных языках и диалектах мира», однако введение критериев отбора этому противоречит. Не хватает тут же пары предложений в духе «Однако не любое слово или словосочетание может войти в состав Викисловаря. Ниже приведены критерии включения в него языковых единиц».
  3. Для чего нужен «принцип многозначности слова» (тем более что в пояснении речь идет не только о словах)? Получается, если единица не многозначная, то она не отвечает критериям?
  4. Про принцип частотности, о котором выше я уже писал. В том виде, в котором он сформулирован сейчас, он не имеет практической ценности. Что значит «чем чаще <…>, тем предпочтительнее»? В какой «речи» — устной или письменной? С моей точки зрения, если и говорить о частотности, то нужно установить какой-то четкий критерий, например «не менее такого-то количества употреблений в течение такого-то периода в таких-то источниках».
  5. Вот с отрицательными критериями все четко: не включаем это и это. Правда, понятие «свободные сочетания», мне кажется, нужно подробно раскрыть в сопоставлении с понятием «устойчивое сочетание» (словари фразеологизмов все-таки существуют, и к ним можно апеллировать, а с устойчивыми сочетаниями и их типами все гораздо сложнее). И добавить как можно больше разнообразных примеров с пояснениями, почему это свободное сочетание (названия орденов и т. п.).
  6. По поводу фразеологических выражений — однозначно необходим здесь их закрытый список. Пословицы, поговорки и крылатые выражения (или крылатые фразы?) — это полный перечень? Сейчас в разделе «Фразеологизмы и устойчивые сочетания» на разных страницах встречаются еще — в качестве заголовков четвертого уровня — загадки, палиндромы, (народные) приметы, типичные сочетания, названия мостов и государства (см. тут). В связи с этим, кстати, есть еще один важный вопрос: нужно ли разграничивать все это внутри раздела «Фразеологизмы и устойчивые сочетания», и если да, то насколько подробно?
  7. Для терминов указано требование фиксации в словарях или наличия примеров, а для остального — нет. По-хорошему, мне кажется, любой редактор, создающий новую статью, обязан добавить как минимум примеры употребления со ссылками на источники цитат, а вообще хотелось бы видеть еще и ссылку на авторитетный печатный источник (словарь) в разделе «Библиография», если языковая единица кодифицирована.
  8. В тексте критериев сейчас не хватает примеров из других языков.
  9. Про названия партий и в связи с предыдущим замечанием. Статья Нұр Отан может быть создана? Для казахского языка это название партии является «уникальным именем собственным»? Если я правильно понял этот критерий, то в каждый языковой раздел, получается, можно добавлять только иноязычные названия партий, записанные кириллицей?
  10. Все-таки когда речь идет о критериях, самой логичной и понятной для любого читателя была бы структура вроде чек-листа: ‘перед тем как создать новую страницу на Викисловаре, убедитесь в том, что включаемая лексическая единица отвечает перечисленным ниже требованиям’ (обладает семантической или словообразовательной ценностью, является частотной и т. д.). treskful 21:21, 25 августа 2021 (UTC)[ответить]

О числах и цифрах[править]

Сейчас в тексте: «цифры (например 12, 1000)». Ни 12, ни 1000 цифрой не является. Кроме того, «числа более 100» нужно ограничить натуральным рядом. Cinemantique (обсуждение) 17:54, 28 сентября 2021 (UTC)[ответить]

Приметы (земледельческие, погодные) из Словаря В. Даля[править]

Сейчас некоторые приметы размещены после ==== Пословиц и поговорок ====. Может, лучше их в Приложение? --Bookvaedina (обсуждение) 14:15, 6 ноября 2022 (UTC)[ответить]

Добавить в ВС:КВС персонажей народных сказок[править]

Вношу предложение изложить раздел "Ономастика" ВС:КВС в следующей редакции:

«В словарь включаются следующие имена собственные:

имена людей (Пётр, Олег, Мария, Нина), фамилии (Иванов, Петров, Салтыков-Щедрин, Римский-Корсаков), отчества (Петрович, Олегович, Марковна), псевдонимы (Горький, Ленин), клички животных‎ (Шарик, Мурка);

имена богов и божеств любого пантеона (Аллах, Стрибог, Зевс, Виракоча), персонажей сказок, мифов и легенд любого народа (Талия, Академ, Золушка), а также персонажей священных книг всех традиционных религий и наиболее распространённых новых религиозных движений (Яхве, Христос, Хава, Мормон, Мороний);
»

Раз здесь есть мифы и легенды - то должны быть и народные сказки.--MaksOttoVonStirlitz (обсуждение) 13:15, 6 ноября 2022 (UTC)[ответить]

Вот список русских сказок из сборника Афанасьева — вы действительно предлагаете включить в ВС все имена собственные героев, которые там упоминаются? В реальности персонажей только русских сказок намного больше, конечно. Сомневаюсь, что Спящая красавица уместна в словаре, а не в энциклопедии. treskful (вклад) 14:02, 8 ноября 2022 (UTC)[ответить]
Вы действительно предлагаете включить в ВС все имена собственные героев, которые там упоминаются? - да, и не вижу причин этого не делать. Миф, как и сказка - тот же вымысел, только призванный объяснить что-то глобальное (создание мира, происхождение народа, основы религии и т. п.) И там, и там мы имеем дело с вымышленными персонажами, чьи имена, как правило, хорошо известны. --MaksOttoVonStirlitz (обсуждение) 23:15, 8 ноября 2022 (UTC)[ответить]
А литературные сказки нужно брать? treskful (вклад) 07:47, 9 ноября 2022 (UTC)[ответить]
Если и брать, то только наиболее известные (к примеру, сказки Астрид Линдгрен и "Алису в Стране Чудес" Кэрролла).--MaksOttoVonStirlitz (обсуждение) 09:56, 9 ноября 2022 (UTC)[ответить]
Как измерить известность? Нужны четкие критерии. Мифы и народные сказки — понятно, где граница. «Наиболее известные» — нет. treskful (вклад) 10:02, 9 ноября 2022 (UTC)[ответить]
Раз уж зашла речь о критериях известности произведений, то предлагаю, во-первых, рассматривать не только сказки, но и любые другие авторские литературные произведения. Во-вторых, в качестве одного из критериев предлагаю установить частотность упоминаний имени персонажа в НКРЯ (за исключением его упоминаний в тексте произведения, героем которого он является). Если имя персонажа встречается в НКРЯ (вне текста произведения) более 5 раз (пример), то его можно включать в словарь. --MaksOttoVonStirlitz (обсуждение) 11:17, 9 ноября 2022 (UTC)[ответить]
Treskful, что думаете? --MaksOttoVonStirlitz (обсуждение) 09:39, 13 февраля 2023 (UTC)[ответить]
НКРЯ не кажется мне достаточно репрезентативным источником, а включение в словарь всех имен собственных и свободных словосочетаний типа район имени Лазо считаю размыванием границ ВС:КВС. treskful (вклад) 09:00, 15 февраля 2023 (UTC)[ответить]
В смысле свободных? Это топоним, в ВС:КВС прямо допускает включение топонимов в словарь.--MaksOttoVonStirlitz (обсуждение) 03:05, 23 февраля 2023 (UTC)[ответить]
Одно дело Гибралтар, а другое — улица имени… (подставьте любое имя собственное). Думаю, достаточно одной статьи для всех таких топонимов с названием вроде того, что я привел: не сто́ит превращать словарь в энциклопедию. treskful (вклад) 18:04, 25 февраля 2023 (UTC)[ответить]
При чем здесь улицы? Это название административной единицы.--MaksOttoVonStirlitz (обсуждение) 10:00, 26 февраля 2023 (UTC)[ответить]
Не вижу разницы между улицей имени кого-то и районом имени кого-либо. Сомневаюсь в том, что это факт языка. treskful (вклад) 15:43, 2 марта 2023 (UTC)[ответить]
Не сомневайтесь. В ВС:КВС однозначно говорит о том, что топонимы в словарь включаются, и не допускает никаких исключений как для топонимов имени кого-то, так и для чего бы то ни было другого. Могу согласиться с тем, что включение в словарь улиц - вопрос дискуссионный. Но раз уж в правиле черным по белому прописаны населённые пункты, то не включать административные единицы (как более крупные образования) - абсурд. --MaksOttoVonStirlitz (обсуждение) 16:10, 2 марта 2023 (UTC)[ответить]
Именно поэтому, на мой взгляд, вопрос о топонимах в ВС:КВС требует дальнейшего обсуждения. treskful (вклад) 11:29, 5 марта 2023 (UTC)[ответить]
Предлагаю критерий: АИ. Упоминается в АИ - а не форумах, фанатских сайтах и зависимых источниках - значит включаем. Ещё круче - вторичные АИ. Или частотность в СМИ: есть 10 упоминай в 10 разных - есть статья. — Ирука13 02:07, 22 июня 2023 (UTC)[ответить]
Собственно, да.
Только возникает тонкий момент: часть слов не смогут быть на других языках, в т. ч. русском. — Ирука13 18:11, 28 июня 2023 (UTC)[ответить]

Названия улиц[править]

Названия улиц включаются в ВС или нет и почему? Навеяно этой правкой и обсуждением выше (про персонажей сказок). Мне кажется, это нужно четко прописать. treskful (вклад) 08:55, 23 мая 2023 (UTC)[ответить]

Вероятно, что одним из положительных критериев может быть наличие слова в авторитетных словарях. Например, у Зализняка кроме Арбата есть Якиманка. Отрицательным критерием для улицы может быть обычность словообразования составляющих её слов (стрелковый из той ссылки, бауманский, шарикоподшипниковский). Halfcookie (обсуждение) 23:42, 24 мая 2023 (UTC)[ответить]
Предлагаю прописать в КВС такую формулировку:
«Названия улиц и площадей, если они являются уникальными именами собственными (Арбат, Якиманка, Крещатик, Тяньаньмэнь). Указанные названия, которые не являются уникальными именами собственными, в словарь не включаются (улица Ленина, Стрелковая улица, Тихий переулок, площадь Свободы).»

--MaksOttoVonStirlitz (обсуждение) 11:35, 12 ноября 2023 (UTC)[ответить]

Отрицательные критерии 2[править]

У меня вопрос насчёт w:MI5 / MI6. upd. И "А4", кстати. — Ирука13 10:21, 16 июня 2023 (UTC)[ответить]

Для русского языка слово должно быть написано кириллицей. Не вижу причин, по которым в ВС не должно быть статьи МИ-5. treskful (вклад) 20:42, 21 июня 2023 (UTC)[ответить]

В Справке дважды упоминается, что мы рады всем словам. У меня не получилось лаконично сформулировать поправку. — Ирука13 07:03, 29 июня 2023 (UTC)[ответить]

О, там кладезь того, что сильно устарело. treskful (вклад) 08:38, 9 июля 2023 (UTC)[ответить]