Викисловарь:Работа для бота

Материал из Викисловаря
Перейти к навигации Перейти к поиску

Данная страница является разделом форума Викисловаря и предназначена для обсуждения массовых правок и других автоматизированных задач.

Внимание! Для обсуждения других вопросов предназначены отдельные страницы:

  • Викисловарь:Лингвистические и лексикографические вопросы — обсуждение содержательных вопросов, связанных с лингвистикой и лексикографией (что значит и как переводится то или иное слово, как оно склоняется или спрягается, к какому семантическому классу принадлежит и т. п.);
  • Викисловарь:Организационные вопросы — обсуждение организационных вопросов (структура и оформление Викисловаря, изменение статуса участников и страниц, претензии, разрешение конфликтов, действия относительно вандализма и т. п.);
  • Викисловарь:Технические вопросы — обсуждение технических вопросов (детали программирования, создание ботов, использование синтаксиса разметки, механизм функционирования шаблонов и категорий и т. п.);
  • Викисловарь:Вопросы общения — обсуждение вопросов общения, взаимодействия участников проекта (прежде всего викивстречи и викиконференции);
  • Викисловарь:Лицензионные вопросы — обсуждение лицензионных вопросов (статус используемых материалов);

Общий архив обсуждения: 2004—2006 | 2006 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 
Архивы более старых обсуждений: 2014—2015 | 2016 


Пожалуйста, добавляйте новые темы сверху. Добавить…

См. также:


Просьба: новые темы снабжать заголовком (== ==) и добавлять под этими рекомендациями, но над прежними темами.


Короткая ссылка-перенаправлениеGtk-redo-ltr.svg
ВС:РДБ

Перенос в дополнительные пространства[править]

Нельзя ли автоматизировать перенос статей, помеченных тегами {{wrongname|}} и {{нет примеров}} в дополнительные пространства (Викисловарь:Ошибки/ и Викисловарь:Фантомы/), с формированием соответствующих перенаправлений? Ручное переименование после простановки тега - выглядит излишним. --G2018 (обсуждение) 04:48, 24 октября 2018 (UTC)

  • Я считаю, лучше создавать эти страницы сразу в дополнительном пространстве, а ботом делать перенаправления постфактум. Нет риска завалить основное пространство грудой мусора в случае поломки бота. Cinemantique (обсуждение) 14:11, 27 октября 2018 (UTC)
  • спасибо тому, кто сделал запрошенное. Например перенос --G2018 (обсуждение) 04:12, 29 октября 2018 (UTC)

Автоматизированное заполнение поля родственных слов[править]

Имею в виду не добавление ботом чего попало, но мониторинг связей однокоренных слов с другими и обновление родительской или дочерней статьей соответствующим образом. Например, сравните вызвать/вызывать и подзывать. В первых случаях "подзывать" даже числится в списке родственных. Тем не менее, второй случай говорит, что родственных еще не завезли.
Я думаю, что автоматизация этого сохранит время например мне, который, зайдя в статью подзывать, надеется найти там ссылку на глагол более широкого плана, типа звать.
___
Сейчас я поделюсь еще одной задумкой необъятного в исполнении масштаба. Это статьи с корнями. Например, префикс вы- есть, суффикс есть, а корня -зв- нет? Непорядок! Порядок, на самом деле, если подумать. Но, связанная с первой частью моей темы, эта идея, как говорится, makes sense. Создастся своего рода реестр с исконными значениями корней (взятых из уважаемых источников, касающихся этимологии слов), откуда можно будет брать информацию о собственно этимологии (тогда, когда дело от "пересозвать" доходит до "созвать" и, следовательно, "звать"), где будет находиться список слов, использующих этот корень. Имею в виду подобие Служебная:Ссылки_сюда/вызывать и/или явь#Родственные_слова. Что думаете? Громоздко? :) — Blazedroot72 (обсуждение) 11:23, 12 августа 2018 (UTC)

Конечно, списки родственных слов должны быть синхронизированы. Для этого создаются соответствующие Шаблоны родственных слов (см. подкатегории по языкам). А про корень. Реестр слов с конкретным корнем - это у нас и есть список родственных слов в шаблоне :) А страницы о корнях можно посоздавать! Уже есть немного: Русские корни. --Infovarius (обсуждение) 16:11, 12 сентября 2018 (UTC)

Статьи о глаголах с возвратными суффиксами[править]

Здравствуйте! Заметил, что в разделе этимологии в статьях глаголов с возвратными постфиксами чаще всего стоят "??", даже если они образованы от очевидного глагола без такового. Например, ловить и ловиться. Естественно, подобная схема подойдет не ко всем глаголам (оставаться, например (хотя чего это я, там же даже формы без -ся нет). Другая группа глаголов будет отражать "странность" родства с якобы (естественно не якобы, но все же) родственным словом: удалять и удаляться в значении "уходить".
Тем не менее, проверить попавшиеся глаголы на принадлежность к первой и второй с третьей группам готов лично. Есть ли возможность автоматизировать сбор подобных словоформ?
Насчет амбициозности замысла приношу извинения — написано со скуки на работе. К тому же, я совсем новенький в рядах как добровольных редакторов, так и ботоводов.
Тем не менее, приму всю критику, предложения и ответы: есть ли будущее у задумки? не слишком ли много будет глаголов, требующих внимания? — Эта реплика добавлена участником Blazedroot72 (о · в) 16:34, 11 августа 2018

  • См. Участник:Vitalik/reports/verbs, возможно, поможет. --- Валентин 16:37, 11 августа 2018 (UTC)
  • Могу подготовить отчёт специально по возвратности глаголов. В каком виде и по какому принципу лучше это сделать? — Vitalik обс 17:07, 11 августа 2018 (UTC)
    • Vitalik, вас не затруднит рассказать, какие виды и принципы возможны? У меня нет достаточного (никакого, если быть точнее) опыта, связанного с редактированием — я только начинаю потихоньку делать всё лучше, опираясь на правки и внешний вид статей таких мастеров, как вы все тут. Тем не менее, хочу сделать что-нибудь полезное. Просто не знаю, каким образом. Подскажете? — Blazedroot72 (обсуждение) 06:36, 12 августа 2018 (UTC)
Если бот в состоянии проверить наличие существующей статьи о соответствующем невозвратном глаголе (скажем, проверяем для ловиться, есть ли ловить), то при положительном результате этот бот мог бы в секции "Этимология" заменять выражение Происходит от ?? на {{-ся|[[ловить]]}}, далее из {{этимология:|да}} --Al Silonov (обсуждение) 07:14, 12 августа 2018 (UTC)
  • Я сейчас начал проверять, как это можно было бы автоматизировать. Остановился на Шаблон:произв, чтобы понять, как нужно это делать.
Получил: "{{произв|ru|ч|ся|множить}}" раскрывается в следующее:
"Образовано с помощью постфикса -ся от множить, далее от Шаблон:этимология:множить".
Написал об этом в Обсуждение Викисловаря:Этимология.
UPD. Дочитал шаблон. Понял, что я был неправ. Используем вариант Al Silonov? Он выглядит более дружелюбным в этом случае. — Blazedroot72 (обсуждение) 08:25, 12 августа 2018 (UTC)

Деепричастия прошедшего времени[править]

Al Silonov, DonRumata, Cinemantique, ‎Мартын 48, Vitalik --- Валентин 13:34, 15 апреля 2018 (UTC): Уже создано свыше 40,5 тысяч статей о русских глаголах. Это свыше 90 % от всех, зафиксированных в словарях глаголов. Практически остались те глаголы, которые не употребляются или употребляются чрезвычайно редко. Алгоритм создания статей о деепричастиях пр. вр. довольно прост. Проходим по списку существующих глаголов и отсекаем те, которые состоят менее, чем из 4 букв и те, внутри которых есть знак «-». Нас интересуют, в первую очередь, глаголы на «-ать», «-еть» (кроме самого «еть» и кроме тех, что заканчиваются на -ереть - там надо вместо -ереть ставить - ерев (первое деепричастие) и -ёрши (второе деепричастие)), «-ить», «-оть», «-уть», «-ыть» и «-ять». На их основе создаются соответствующие статьи (по две сразу!) для деепричастий. Поскольку ударения проставлены везде (надеюсь), то просто отнимаем «ть» и добавляем «в» и «вши». Статьи генерируются на ура! Во вторую очередь просматриваем глаголы на «-аться», «-еться» (кроме самого «еться»), «-иться», «-оться», «-уться», «-ыться» и «-яться». Отнимаем «ться» и добавляем «вшись» — вуаля! статья готова! Предлагаю проголосовать за автоматическое создание статей ботом и выбрать собственно участника с ботом, кто согласится на это. (Мой бот не работает).

За[править]

  1. Symbol support vote.png За. Поскольку сам и предложил. --- Валентин 14:36, 15 апреля 2018 (UTC)
  2. Symbol support vote.png За. Кажется, ошибок не должно быть для глаголов на «гласная + -ть», хотя алгоритм отличается от зализняковского (прош. м. → прич. прош. → дееприч. прош.); нужно ещё уточнить по поводу возвратных глаголов.--Cinemantique (обсуждение) 01:59, 16 апреля 2018 (UTC)
  3. Symbol support vote.png За. Если такие статьи всё равно нужно создавать, и они при этом легко создаются ботом, то почему бы ботом это и не сделать в итоге. Только может быть стоит вначале автоматически создать соответствующие списки и вычитать их хотя бы по-диагонали, и только потом создавать статьи? Дабы избежать неприятных сюрпризов. — Vitalik обс 19:40, 16 апреля 2018 (UTC)

Против[править]

Воздержались[править]

Итог[править]

Автозамена онимов[править]

Возможно ли в статьях, где идёт текст:

==== Синонимы ====

==== Антонимы ====

==== Гиперонимы ====

==== Гипонимы ====

=== Родственные слова ===

заменить его на текст:

==== Синонимы ====
#
#

==== Антонимы ====
#
#

==== Гиперонимы ====
#
#

==== Гипонимы ====
#
#

=== Родственные слова ===

? --- Валентин 17:20, 8 февраля 2018 (UTC)

А может с одной решёткой? В большинстве случаев одно значение, а надоело убирать лишние. --Infovarius (обсуждение) 20:21, 5 марта 2018 (UTC)
Да с двумя-то лучше: проще добавлять новое значение (сразу же ставя еще одну "лишнюю решетку), а вреда от этого "лишнего" нет -- это как бы маркер последнего наличествующего элемента списка и приглашение дополнять. Убирать их не надо, я, если вижу, восстанавливаю. --Al Silonov (обсуждение) 21:44, 5 марта 2018 (UTC)
Кстати вред есть - Aard почему-то не умеет их убирать и в результате везде виднеются эти пустые элементы списка. --Infovarius (обсуждение) 10:09, 3 апреля 2018 (UTC)

Ошибка в бурятских словах[править]

Коллеги, нельзя ли пройтись ботом по Категория:Бурятский язык и после "= {{-bua-}} =" добавить с новой строки "=== Морфологические и синтаксические свойства ===" - там, где этот раздел отсутствует? Ошибся при создании заготовки для копирования, и ошибка перекочевала в значительное число статей. Заранее спасибо.--MaksOttoVonStirlitz (обсуждение) 09:50, 26 декабря 2017 (UTC)

  • Ещё требуется выполнить? ----Pavliukdanila (обсуждение) 08:02, 21 января 2018 (UTC)
    • Да--MaksOttoVonStirlitz (обсуждение) 08:30, 21 января 2018 (UTC)
      • Выполняю --Pavliukdanila (обсуждение) 10:07, 21 января 2018 (UTC)
        • Спасибо =) Забыл сразу сказать, что в словосочетаниях эту вещь добавлять не нужно (пример). Можешь откатить в них?--MaksOttoVonStirlitz (обсуждение) 14:23, 21 января 2018 (UTC)
          • Жаль, что сразу не сказал((. К сожалению, такое можно исправить только ручками. Насколько я вижу, таких статьи 24. Завтра утром по исправляю. Они в подкатегории устойчивые сочетания. --Pavliukdanila (обсуждение) 15:20, 21 января 2018 (UTC)
Итог[править]

Yes check.svg Выполнено. --Pavliukdanila (обсуждение) 00:05, 22 января 2018 (UTC)

Статьи о казахских словах[править]

В связи с введением нового алфавита казахского языка на основе латиницы предлагаю продумать бот, который считывает статью о казахском слове на кириллице, преобразует его в статью о казахском слове на латиницу и создаёт эту статью. Сейчас в ВС имеется 16 тысяч слов на кириллице. Не плохо бы было иметь ещё 16 тысяч на латинице. Выскажитесь, пожалуйста, по этому поводу. --- Валентин 15:16, 25 ноября 2017 (UTC)

  • Symbol support vote.png За. В идеале хорошо бы так сделать и для других языков с разными алфавитами - узбекского, азербайджанского, монгольского и.т.д. И совсем в идеале - поставить это дело на автомат: чтобы, например, при создании кем-либо из участников слова на одном алфавите автоматически создавались его аналоги на других, и между всеми вариантами слова проставлялись ссылки. Последнее, естественно, с последующей проверкой человеком. Сам думал о том, чтобы предложить нечто подобное, но вы меня опередили =) --MaksOttoVonStirlitz (обсуждение) 15:53, 25 ноября 2017 (UTC)
    • UPD: если будем делать, то нужно слова в разных алфавитах раскидать по разным категориям: Категория:Казахский язык (кириллица), Категория:Казахский язык (латиница) и.т.д. --MaksOttoVonStirlitz (обсуждение) 16:50, 25 ноября 2017 (UTC)
      • UPD2: предлагаю пока повременить с казахской латиницей. В казахстанском обществе отношение к ней (особенно - к буквам с апострофами) достаточно неоднозначное (пруф, еще). Лучше подождать до тех пор, пока на новом алфавите не начнет издаваться основная часть литературы - либо до тех пор, пока Назарбаев не скорректирует проект алфавита. Прецедент был - в первоначальном варианте латиницы специфические казахские звуки обозначались диграфами, потом (из-за критики) их заменили на буквы с апострофами. Есть вероятность, что заменят на что-то еще.
        Пока же предлагаю научить бота автоматически создавать статьи на узбекской кириллице/латинице. В Узбекистане вот уже почти 30 лет широко используются оба алфавита: де-юре оф. статус только у латиницы, но де-факто кир. и лат. равноправны. Правительственные сайты и сайты основных новостных агентств пишутся на обоих алфавитах (плюс русский, часто плюс английский). Делопроизводство на латинице, в школах преподается латиница, но основная часть литературы выходит на кириллице. Если с узбекским все пройдет хорошо, следующим можно взять азербайджанский. Сам Азербайджан с 2000--х полностью латинизирован, но с советских времен осталось значительное кириллическое наследие.Азербайджанцы Дагестана пишут на кириллице (даже газеты издают), а азербайджанцы Ирана - арабским письмом. Было бы неплохо продублировать азербайджанские слова на всех трех алфавитах - у англичан уже есть что-то подобное.--MaksOttoVonStirlitz (обсуждение) 17:27, 4 декабря 2017 (UTC)

Украинские прилагательные[править]

В этой категории много пустышек, где следует удалять из шаблона словоизменения строку "|show-text=1", в шаблоне {{морфо}} удалять параметр "|частица=", а в шаблоне транскрипции -- менять {{transcriptions}} на {{transcription}}. --Al Silonov (обсуждение) 17:40, 15 ноября 2017 (UTC)

Al Silonov в течении 3 часов мой бот исправит --Pavliukdanila (обсуждение) 01:18, 6 января 2018 (UTC)
Хотя нет, затянется это часов на 10 --Pavliukdanila (обсуждение) 01:22, 6 января 2018 (UTC)
Дней на 14* --Pavliukdanila (обсуждение) 09:54, 8 января 2018 (UTC)

Итог[править]

Yes check.svg Выполнено PavliukBotом. --Pavliukdanila (обсуждение) 08:03, 21 января 2018 (UTC)--Pavliukdanila (обсуждение) 08:03, 21 января 2018 (UTC)

Родственные слова[править]

В разделе с таким названием надо заменять устаревшие конструкции

* уменьш.-ласк. формы:
* имена собственные:
* пр. существительные:
* прилагательные:
* глаголы:
* наречия:

на шаблон

{{родств-блок
|умласк=
|имена-собственные=
|существительные=
|прилагательные=
|числительные=
|глаголы=
|наречия=
|полн=
}}

С подстановкой родственных слов, если они были внесены. --Al Silonov (обсуждение) 16:22, 18 мая 2017 (UTC)

Обсуждаемые в других местах работы[править]

Здесь собираем ссылки на важные обсуждения в других местах.

Заливка словоформ[править]

Заголовки[править]

Графический раздел[править]

Унификация уровней и не только[править]

Смотреть также[править]

Слогоделение[править]

Коды языков[править]

Шаблоны словоизменений[править]