Викисловарь:Работа для бота

Материал из Викисловаря
Перейти к навигации Перейти к поиску

Данная страница является разделом Портала сообщества Викисловаря и предназначена для обсуждения массовых правок и других автоматизированных задач.

Внимание! Для обсуждения других вопросов предназначены отдельные страницы:

  • Викисловарь:Лингвистические и лексикографические вопросы — обсуждение содержательных вопросов, связанных с лингвистикой и лексикографией (что значит и как переводится то или иное слово, как оно склоняется или спрягается, к какому семантическому классу принадлежит и т. п.);
  • Викисловарь:Организационные вопросы — обсуждение организационных вопросов (структура и оформление Викисловаря, изменение статуса участников и страниц, претензии, разрешение конфликтов, действия относительно вандализма и т. п.);
  • Викисловарь:Технические вопросы — обсуждение технических вопросов (детали программирования, создание ботов, использование синтаксиса разметки, механизм функционирования шаблонов и категорий и т. п.);
  • Викисловарь:Вопросы общения — обсуждение вопросов общения, взаимодействия участников проекта (прежде всего викивстречи и викиконференции);
  • Викисловарь:Лицензионные вопросы — обсуждение лицензионных вопросов (статус используемых материалов);

Общий архив обсуждения: 2004—2006 | 2006 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 
Архивы более старых обсуждений: 2014—2015 | 2016 


Пожалуйста, добавляйте новые темы сверху. Добавить…

См. также:


Просьба: новые темы снабжать заголовком (== ==) и добавлять под этими рекомендациями, но над прежними темами.


Короткая ссылка-перенаправлениеGtk-redo-ltr.svg
ВС:РДБ

Деепричастия прошедшего времени[править]

Al Silonov, DonRumata, Cinemantique, ‎Мартын 48, Vitalik --- Валентин 13:34, 15 апреля 2018 (UTC): Уже создано свыше 40,5 тысяч статей о русских глаголах. Это свыше 90 % от всех, зафиксированных в словарях глаголов. Практически остались те глаголы, которые не употребляются или употребляются чрезвычайно редко. Алгоритм создания статей о деепричастиях пр. вр. довольно прост. Проходим по списку существующих глаголов и отсекаем те, которые состоят менее, чем из 4 букв и те, внутри которых есть знак «-». Нас интересуют, в первую очередь, глаголы на «-ать», «-еть» (кроме самого «еть» и кроме тех, что заканчиваются на -ереть - там надо вместо -ереть ставить - ерев (первое деепричастие) и -ёрши (второе деепричастие)), «-ить», «-оть», «-уть», «-ыть» и «-ять». На их основе создаются соответствующие статьи (по две сразу!) для деепричастий. Поскольку ударения проставлены везде (надеюсь), то просто отнимаем «ть» и добавляем «в» и «вши». Статьи генерируются на ура! Во вторую очередь просматриваем глаголы на «-аться», «-еться» (кроме самого «еться»), «-иться», «-оться», «-уться», «-ыться» и «-яться». Отнимаем «ться» и добавляем «вшись» — вуаля! статья готова! Предлагаю проголосовать за автоматическое создание статей ботом и выбрать собственно участника с ботом, кто согласится на это. (Мой бот не работает).

За[править]

  1. Symbol support vote.png За. Поскольку сам и предложил. --- Валентин 14:36, 15 апреля 2018 (UTC)
  2. Symbol support vote.png За. Кажется, ошибок не должно быть для глаголов на «гласная + -ть», хотя алгоритм отличается от зализняковского (прош. м. → прич. прош. → дееприч. прош.); нужно ещё уточнить по поводу возвратных глаголов.--Cinemantique (обсуждение) 01:59, 16 апреля 2018 (UTC)
  3. Symbol support vote.png За. Если такие статьи всё равно нужно создавать, и они при этом легко создаются ботом, то почему бы ботом это и не сделать в итоге. Только может быть стоит вначале автоматически создать соответствующие списки и вычитать их хотя бы по-диагонали, и только потом создавать статьи? Дабы избежать неприятных сюрпризов. — Vitalik обс 19:40, 16 апреля 2018 (UTC)

Против[править]

Воздержались[править]

Итог[править]

Автозамена онимов[править]

Возможно ли в статьях, где идёт текст:

==== Синонимы ====

==== Антонимы ====

==== Гиперонимы ====

==== Гипонимы ====

=== Родственные слова ===

заменить его на текст:

==== Синонимы ====
#
#

==== Антонимы ====
#
#

==== Гиперонимы ====
#
#

==== Гипонимы ====
#
#

=== Родственные слова ===

? --- Валентин 17:20, 8 февраля 2018 (UTC)

А может с одной решёткой? В большинстве случаев одно значение, а надоело убирать лишние. --Infovarius (обсуждение) 20:21, 5 марта 2018 (UTC)
Да с двумя-то лучше: проще добавлять новое значение (сразу же ставя еще одну "лишнюю решетку), а вреда от этого "лишнего" нет -- это как бы маркер последнего наличествующего элемента списка и приглашение дополнять. Убирать их не надо, я, если вижу, восстанавливаю. --Al Silonov (обсуждение) 21:44, 5 марта 2018 (UTC)
Кстати вред есть - Aard почему-то не умеет их убирать и в результате везде виднеются эти пустые элементы списка. --Infovarius (обсуждение) 10:09, 3 апреля 2018 (UTC)

Ошибка в бурятских словах[править]

Коллеги, нельзя ли пройтись ботом по Категория:Бурятский язык и после "= {{-bua-}} =" добавить с новой строки "=== Морфологические и синтаксические свойства ===" - там, где этот раздел отсутствует? Ошибся при создании заготовки для копирования, и ошибка перекочевала в значительное число статей. Заранее спасибо.--MaksOttoVonStirlitz (обсуждение) 09:50, 26 декабря 2017 (UTC)

  • Ещё требуется выполнить? ----Pavliukdanila (обсуждение) 08:02, 21 января 2018 (UTC)
    • Да--MaksOttoVonStirlitz (обсуждение) 08:30, 21 января 2018 (UTC)
      • Выполняю --Pavliukdanila (обсуждение) 10:07, 21 января 2018 (UTC)
        • Спасибо =) Забыл сразу сказать, что в словосочетаниях эту вещь добавлять не нужно (пример). Можешь откатить в них?--MaksOttoVonStirlitz (обсуждение) 14:23, 21 января 2018 (UTC)
          • Жаль, что сразу не сказал((. К сожалению, такое можно исправить только ручками. Насколько я вижу, таких статьи 24. Завтра утром по исправляю. Они в подкатегории устойчивые сочетания. --Pavliukdanila (обсуждение) 15:20, 21 января 2018 (UTC)
Итог[править]

Yes check.svg Выполнено. --Pavliukdanila (обсуждение) 00:05, 22 января 2018 (UTC)

Статьи о казахских словах[править]

В связи с введением нового алфавита казахского языка на основе латиницы предлагаю продумать бот, который считывает статью о казахском слове на кириллице, преобразует его в статью о казахском слове на латиницу и создаёт эту статью. Сейчас в ВС имеется 16 тысяч слов на кириллице. Не плохо бы было иметь ещё 16 тысяч на латинице. Выскажитесь, пожалуйста, по этому поводу. --- Валентин 15:16, 25 ноября 2017 (UTC)

  • Symbol support vote.png За. В идеале хорошо бы так сделать и для других языков с разными алфавитами - узбекского, азербайджанского, монгольского и.т.д. И совсем в идеале - поставить это дело на автомат: чтобы, например, при создании кем-либо из участников слова на одном алфавите автоматически создавались его аналоги на других, и между всеми вариантами слова проставлялись ссылки. Последнее, естественно, с последующей проверкой человеком. Сам думал о том, чтобы предложить нечто подобное, но вы меня опередили =) --MaksOttoVonStirlitz (обсуждение) 15:53, 25 ноября 2017 (UTC)
    • UPD: если будем делать, то нужно слова в разных алфавитах раскидать по разным категориям: Категория:Казахский язык (кириллица), Категория:Казахский язык (латиница) и.т.д. --MaksOttoVonStirlitz (обсуждение) 16:50, 25 ноября 2017 (UTC)
      • UPD2: предлагаю пока повременить с казахской латиницей. В казахстанском обществе отношение к ней (особенно - к буквам с апострофами) достаточно неоднозначное (пруф, еще). Лучше подождать до тех пор, пока на новом алфавите не начнет издаваться основная часть литературы - либо до тех пор, пока Назарбаев не скорректирует проект алфавита. Прецедент был - в первоначальном варианте латиницы специфические казахские звуки обозначались диграфами, потом (из-за критики) их заменили на буквы с апострофами. Есть вероятность, что заменят на что-то еще.
        Пока же предлагаю научить бота автоматически создавать статьи на узбекской кириллице/латинице. В Узбекистане вот уже почти 30 лет широко используются оба алфавита: де-юре оф. статус только у латиницы, но де-факто кир. и лат. равноправны. Правительственные сайты и сайты основных новостных агентств пишутся на обоих алфавитах (плюс русский, часто плюс английский). Делопроизводство на латинице, в школах преподается латиница, но основная часть литературы выходит на кириллице. Если с узбекским все пройдет хорошо, следующим можно взять азербайджанский. Сам Азербайджан с 2000--х полностью латинизирован, но с советских времен осталось значительное кириллическое наследие.Азербайджанцы Дагестана пишут на кириллице (даже газеты издают), а азербайджанцы Ирана - арабским письмом. Было бы неплохо продублировать азербайджанские слова на всех трех алфавитах - у англичан уже есть что-то подобное.--MaksOttoVonStirlitz (обсуждение) 17:27, 4 декабря 2017 (UTC)

Украинские прилагательные[править]

В этой категории много пустышек, где следует удалять из шаблона словоизменения строку "|show-text=1", в шаблоне {{морфо}} удалять параметр "|частица=", а в шаблоне транскрипции -- менять {{transcriptions}} на {{transcription}}. --Al Silonov (обсуждение) 17:40, 15 ноября 2017 (UTC)

Al Silonov в течении 3 часов мой бот исправит --Pavliukdanila (обсуждение) 01:18, 6 января 2018 (UTC)
Хотя нет, затянется это часов на 10 --Pavliukdanila (обсуждение) 01:22, 6 января 2018 (UTC)
Дней на 14* --Pavliukdanila (обсуждение) 09:54, 8 января 2018 (UTC)

Итог[править]

Yes check.svg Выполнено PavliukBotом. --Pavliukdanila (обсуждение) 08:03, 21 января 2018 (UTC)--Pavliukdanila (обсуждение) 08:03, 21 января 2018 (UTC)

Родственные слова[править]

В разделе с таким названием надо заменять устаревшие конструкции

* уменьш.-ласк. формы:
* имена собственные:
* пр. существительные:
* прилагательные:
* глаголы:
* наречия:

на шаблон

{{родств-блок
|умласк=
|имена-собственные=
|существительные=
|прилагательные=
|числительные=
|глаголы=
|наречия=
|полн=
}}

С подстановкой родственных слов, если они были внесены. --Al Silonov (обсуждение) 16:22, 18 мая 2017 (UTC)

Обсуждаемые в других местах работы[править]

Здесь собираем ссылки на важные обсуждения в других местах.

Заливка словоформ[править]

Заголовки[править]

Графический раздел[править]

Унификация уровней и не только[править]

Смотреть также[править]

Слогоделение[править]

Коды языков[править]

Шаблоны словоизменений[править]