Обсуждение участника:Vitalik/Архив/1

Материал из Викисловаря
Перейти к навигации Перейти к поиску
Vista-Ym.png Добро пожаловать!
(If you don’t understand Russian, put {{Babel|ru-0}} on your user page.)

Здравствуйте, и добро пожаловать в русскоязычную часть Викисловаря! Надеемся, Вы получите большое удовольствие от участия в проекте. Ниже приведены некоторые полезные для начинающих ссылки:

Рекомендуем обратить особое внимание на раздел Правила оформления статей (несоблюдение приведённых там правил может привести к тому, что Ваши правки будут отвергнуты).

См. также:

Для начала мы просим вас благоустроить вашу личную страницу участника с помощью шаблонов «Babel». Это необходимо для удобства — чтобы другие участники Викисловаря могли ориентироваться, на каком языке к вам обращаться (например, понимаете ли вы по-немецки или по-французски.

Если вы предпочитаете участвовать в улучшении существующих статей, загляните в раздел «начатые статьи».

По всем вопросам смело обращайтесь в портал сообщества или к одному из администраторов. Ответы на многие вопросы есть в нашей справке.

При этом, пожалуйста, подписывайтесь на страницах обсуждения (но не в словарных статьях), используя четыре идущих подряд знака тильды (~~~~). И ещё раз — добро пожаловать! :-)


Содержание

Индексы[править]

А зачем вы добавляете #section. Это лишнее. Ничего полезного нам не даёт. И еще мне не нравится, секция «Словари» и шаблон {{С}}. Лучше это оформлять примечаниями с помощью <ref> Don Rumata 14:01, 3 августа 2013 (UTC)

#section по аналогии с английским ВС: a1 чтобы была возможность легко перейти на другой слог. И чтобы этот блок можно было единожды написать разместить сразу во всех подзаголовках.
Также у меня была идея сделать отдельно блоки ссылок вида: "ра, рб, рв, ..." и "раб, рав, раг, ..." т.е. двухбуквенные и трехбуквенные..
Та страница еще не готова, она пока для экспериментов..
По поводу последнего вашего изменения: "sup" не подходит, т.к. тогда беда с float-стилями получается. "sub" не подходит по той же причине.
По поводу "ref" мне просто показалось, что там не очень удобно дублировать сноску в нескольких местах, возможно ошибся, надо изучить этот момент подробнее.. --Vitalik7 (обсуждение) 14:11, 3 августа 2013 (UTC)
Я, честно говоря, вообще не вижу смысла в ссылках на словарь Лопатина. Если включать #section, то придётся оформлять секции заголовками третьего уровня, как у американцев. Но мне это не нравится. Не вижу в этом никакой пользы. Don Rumata 14:18, 3 августа 2013 (UTC)
Что именно не нравится?.. Сами заголовки можно оставить второго уровня, как предложил в индексе "Р1", просто некоторые из них будут двубуквенные, а некоторые трехбуквенные.
Еще надо выяснить, что нужно от индекса, как им чаще всего будут пользоваться и прочее..
Вариант использования 1: быстро найти нужное слово, тогда разбиение на трехбуквенные секции с перекрестными ссылками становится удобным.
Вариант использования 2: найти слова, которых еще нет в ВС. Для такого использования вообще не имеет значение разбития на страницы.
Вариант использования 3: редактирование списка. Но по идее его чаще всего надо редактировать автоматически, да и само ручное редактирование по идее крайне редкое..
Вариант использование 4: чтение списка, тут главное, чтобы он был визуально удобен и красив..
Еще вопрос, что удобнее: переходить с одной страницы на другую довольно часто или открыть одну страницу, но большую и переходить от слова к слову уже на ней.. Тут не знаю, нужна некая золотая серидина.. --Vitalik7 (обсуждение) 14:26, 3 августа 2013 (UTC)
Переместил в ваши эксперименты в Участник:Vitalik7/С, Участник:Vitalik7/Русский индекс 1, Участник:Vitalik7/Русский язык/Р1. Экспериментируйте, пожалуйста, в своём личном пространстве. Don Rumata 14:27, 3 августа 2013 (UTC)
О! Спасибо, отличная идея. Надо было так и сделать сначала, не догадался. Новичек еще в вики-сообществе. --Vitalik7 (обсуждение) 14:30, 3 августа 2013 (UTC)
Там еще страница Индекс:Русский_язык/Р2, как ее можно ко мне перенести? --Vitalik7 (обсуждение) 14:32, 3 августа 2013 (UTC)
Yes check.svg Переместил. Переоформил одну страницу с использованием локальных шаблонов и ссылок. См. Участник:Vitalik7/Русский язык/Р1. Don Rumata 14:49, 3 августа 2013 (UTC)
Спасибо большое! Научите, пожалуйста, как это делать в дальнейшем, если понадобится? Просто переименовать страницу и выбрать секцию "Участник"?
По поводу ссылок тоже как раз поэкспериментировал с ними, правда без шаблона: Участник:Vitalik7/Русский_язык/Р2, действительно очень удобно! --Vitalik7 (обсуждение) 14:54, 3 августа 2013 (UTC)
Переименовывать страницу можно из выпадающего меню вверху (рядом со полем «поиск» есть стрелочка вниз). Правда переименовывать без создания перенаправления могут только администраторы. Don Rumata 15:28, 3 августа 2013 (UTC)
Исходя из последних сообщений в "технических вопросах": если ссылки на словари из индекса убрать, то визуального конфликта между ними и float-стилем не будет. И тогда использовать их только на специальной странице, на которой будут собраны все красные слова, при чем повсеместно использовать, тогда визуальных "глюков" не будет.. --Vitalik7 (обсуждение) 15:09, 3 августа 2013 (UTC)
А там и не было визуального конфликта. Просто перед тем как удалять ссылки на Лопатина я хочу выслушать мнения всех заинтересованных участников проекта. Часть из них, включая самого заинтересованного Vesailok, сейчас в отпуске. Don Rumata 15:28, 3 августа 2013 (UTC)
Конфликты всё-таки есть.. :( скриншот и пояснения к нему:
1. Если оба слова со сноской или оба без сноски, то они расположены на одной линии друг относительно друга.
2. Если одно из слов со сноской, а другое нет, то сразу видно, что они по-разному выровнены по-вертикали.
3. А иногда вообще слово занимает всю строку и не пускает никакие другие слова на нее. Это особенность float-стиля и того факта, что из-за сносок элементы списка получились разной высоты. --Vitalik7 (обсуждение) 15:47, 3 августа 2013 (UTC)

Индексы 2[править]

Здравствуйте. Несколько месяцев ждал возобновления вашей активности по индексу, но не вытерпел и решил спросить на вашей странице обсуждения о дальнейшей судьбе, начатой вами работы. Надеюсь, вы увидите моё сообщение и как-то на него ответите. Хочу увидеть плоды вашей работы.--Petroglyph (обсуждение) 11:43, 21 октября 2013 (UTC)

Добрый день. Спасибо большое за интерес к моей работе! Это очень приятно.
Ответил по поводу ее судьбы в теме "Викисловарь:Технические вопросы", думаю, там можно и продолжить обсуждение. Надеюсь, его подхватят и другие участники сообщества. --Vitalik7 (обсуждение) 13:41, 21 октября 2013 (UTC)
  • Добрый день. Не могли бы вы сделать список недостающих слов по словарям, указанным в вашей таблице (кроме Даля и Абрамова), в таком формате?--Cinemantique (обсуждение) 12:46, 22 октября 2013 (UTC)
    В ближайшие дни, к сожалению, не получится. Но когда появится свободное время, то постараюсь сделать. Имеется в виду список недостающих слов по отношению к словарю Лопатина, который представлен в русском индексе (именно такая статистика и представлена в теме "Технические вопросы", чтобы показать, что в других словарях очень много слов, отсутствующих в словаре Лопатина) или же нужны только красные слова (т.е. недостающие по отношению к викисловарю)? --Vitalik7 (обсуждение) 13:57, 22 октября 2013 (UTC)
    Для Викисловаря важнее второе. Есть Категория:Русский язык, по которой можно проводить сравнение.--Cinemantique (обсуждение) 14:06, 22 октября 2013 (UTC)

Виталик, не подумайте, что я против Вашей деятельности. Наоборот, я приветствую многие Ваши идеи и мне интересна статистика по словарям, которую вы сделали. Для того, чтобы как-то распараллелить деятельность (и избежать первоначальных конфликтов), предлагаю Вам опробовать их на украинском индексе, например (я заметил, что он для Вас родной). Туда я не планировал соваться в ближайшее время, поэтому можете его обустроить по своему вкусу. А потом сравним подходы и как-то синхронизируем. Как Вам такая идея? --Infovarius (обсуждение) 08:36, 23 октября 2013 (UTC)

Очень рад, что нашел единомышленника в Вашем лице. По поводу предложения заняться украинским индексом (и только им), думаю это не очень хорошая идея. Сейчас поясню свою мысль.
  1. Если говорить о других языках на русском викисловаре, то, думаю, имеет смысл изначально писать нечто универсальное, а не привязываться к конкретному языку. Например, можно попробовать собрать слова на других языках с других викисловарей в единый массив-список. Но это уже отдельная большая тема. И, думаю, в идеале было бы неплохо, чтобы различные направления изначально были выдержаны в некоем едином стиле (тогда, когда это возможно).
  2. Если говорить о синхронизации подходов и результатов, то, мне кажется, на начальном этапе это сделать гораздо проще, чем когда уже будет много различных наработок с обеих сторон. То есть, если говорить о синхронизации, то лучше задаваться этими мыслями сразу, а не откладывать их "на потом".
  3. Если говорить о развитии украинского языка в викисловаре, то заметил такую тенденцию, что в викисловарях различных языков как правило преобладают слова на языке, который используется в викисловаре, а слова на других языках представлены довольно слабо (в сравнении с викисловарем на родном языке). И если заниматься развитием некоего языка, то лучше, как мне кажется, это начинать делать с викисловаря соответствующего языка, а потом уже переносить результаты в викисловари на других языках. Но, в любом случае, это отдельная большая тема.
  4. Ну и последний пункт, просто субъективный. У меня уже есть некоторые наработки с русскими словарями и все-таки хотелось бы воплотить их в жизнь. Равно как и другие идеи.
Кстати, если уж говорить о подходах, позвольте чисто технический вопрос, каким образом Вы считываете информацию о словах из викисловаря? Я пока что считывал их автоматически доставая вики-текст из html-страниц. Видел, что есть специальная библиотека на питоне, но пока что с ней не очень подружился.. --Vitalik7 (обсуждение) 14:35, 23 октября 2013 (UTC)
  1. можно попробовать собрать слова на других языках с других викисловарей в единый массив-список - если Вы имеете в виду собрать все украинские слова из всех языковых разделов Викисловаря, то я это уже умею делать и делал (когда заполнял недостающие категории из Слова по количеству букв - искал по всем разделам сразу).
  2. Украинский Викисловарь гораздо менее развит и украинских слов там даже в несколько раз меньше, чем в русском, где, кстати, украинский - второй по представленности язык. При этом, возможно, Вам будет проще найти нужные словари по этому языку, т.к. я например в нём почти не разбираюсь.
  3. Я большинство операций выполняю своим кодом на Mathematica. Но какие-то стандартные операции (список всех ссылок на странице, всех статей в дереве категорий) можно делать в AutoWikiBrowser. C питоном я тоже не дружу :(, хотя там, наверное, много что можно делать --Infovarius (обсуждение) 05:37, 24 октября 2013 (UTC)
Отвечу также по пунктам :)
  1. Я имел в виду не другие разделы русского словаря, а Викисловари на других языках. Гм.. Или же под языковыми разделами Вы как раз это и подразумевали?
  2. Ясно.. По-видимому высказанное мной наблюдение имеет отношение только к относительно развитым викисловарям..
    • Украинским языком действительно нужно будет заняться в свое время. Но, мне по прежнему кажется, что лучше сначала создать (продолжить создавать) нужные наработки для русского языка, а затем просто так или иначе перенести их на другие языки (в том числе и украинский).
    • Субъективно: в данный момент мне интереснее работать с русским языком, я живу и работаю сейчас в русскоговорящем городе (Харькове) и применять наработки пока планирую для русскоязычных целей. Однако в свое время, думаю, с удовольствием займусь и развитием украинского языка в Викисловаре.
  3. Я с питоном как раз таки дружу, но вот с библиотекой разобраться "по-быстрому" тогда не получилось. Не работали примеры так, как надо. Поэтому показалось, что на тот момент быстрее будет поработать с Викисловарем своими средствами.. К слову, я работаю веб-разработчиком и были идеи сделать автоматизацию анализа статей и генерацию списков человеко-независимой. В самом простом случае, некая веб-система могла бы в своем режиме обрабатывать новые или измененные словарные статьи и по запросу генерировать вики-текст отчетов или списков для вставки в вики-сайт. В принципе эту же операцию можно поручить аналогичным образом написанному боту, который будучи авторизованным от имени специального пользователя будет производить изменения в страницах-отчетах или страницах-списках на Викисловаре.
Подытожив, я думаю, что если мы будем объединять усилия, то выигрыш от этого получим бóльший, чем если каждый будет работать порознь. Если к работе или обсуждению еще подключится человек, имеющий опыт работы с pywikibot, тогда будет совсем замечательно. Подозреваю, что используя эту библиотеку, многие задачи можно будет решить проще и красивее. --Vitalik7 (обсуждение) 10:35, 24 октября 2013 (UTC)
Гм.. Кажется получилось разобраться с pywikibot. Действительно с ним все получится гораздо легче и удобнее, замечательную библиотеку сделали вики-разработчики, просто молодцы! А сложности в прошлый раз возникли, т.к. есть много разных ее версий и почему-то очень много (даже на вики-сайтах) устаревшей информации (документация и примеры на старую версию библиотеки, которые полностью не совместимы с новой версией) --Vitalik7 (обсуждение) 20:44, 27 октября 2013 (UTC)

Vitalik7 vs Vitalik[править]

Не хотите переименоваться? SUL(Vitalik) ещё нету, есть только пара правок в паре проектов - вполне узурпируемо. --Infovarius (обсуждение) 08:37, 4 декабря 2013 (UTC)

Если это возможно — я бы с радостью! А что для этого нужно? :) --Vitalik7 (обсуждение) 10:04, 4 декабря 2013 (UTC)
Попросите бюрократа в домашнем разделе переименовать. Потом создаёте SUL и в тех разделах, где не присоединилась учётка, просите тамошних бюрократов об узурпации. --Infovarius (обсуждение) 11:16, 4 декабря 2013 (UTC)

Шаблоны словоизменений[править]

Перенесено со страницы Викисловарь:Технические вопросы#Шаблоны словоизменений
  • Закрыто. Уважаемые редакторы. Прошу вас обсуждать темы в соответствующих разделах форума. Поднятые тут темы не относятся к техническим вопросам проекта. Перед тем как обсуждать технические детали необходимо выяснить поддержку идеи сообществом на Викисловарь:Организационные вопросы. Постарайтесь кратко изложить суть вашего предложения, его необходимость, степень соответствия целям проекта. 23:44, 29 ноября 2013 (UTC)
    • Уважаемый, Дон Румата. Я не совсем понимаю, по какому праву вы закрываете незавершившиеся обсуждения. Если мы обсуждаем организационные вопросы (что не совсем так), то можно просто перенести обсуждение в другой раздел, а не закрывать его. Но ваша фраза "Перед тем как обсуждать технические детали" свидетельствует о том, что вы согласны с тем, что обсуждаем мы именно технические детали. А обсуждение на то и обсуждение, чтобы выяснить мнение сообщества. К тому же, чтобы "изложить суть предложения", его нужно сначала выработать, а именно для этого это обсуждение и было создано. Если вы считаете, что можете закрывать обсуждения по праву администратора, то в википедии на этот счет вроде бы довольно ясно написано: «Администраторы не имеют каких-либо привилегий в управлении проектом и не имеют права использовать свои возможности для навязывания другим участникам своей точки зрения». Я не совсем понимаю, зачем вам это нужно. Чем мы вам мешаем? --Vitalik7 (обсуждение) 00:09, 1 декабря 2013 (UTC)
      • Я, подобно участнику DonRumata, считаю, что вести вашу деятельность со словоформами, когда мы даже для русских глаголов не пришли к единому их именованию, преждевременно. — soshial@ 06:52, 1 декабря 2013 (UTC)
        • Не совсем так. Если говорить о деятельности со словоформами, то ряд участников в этом заинтересован (Vesailok, Cinemantique, Infovarius), и даже сам DonRumata выразил согласие на то, чтобы попробовать реализовать алгоритм с целью выяснения проблемных моментов, если таковые найдутся. Т.е. с продолжением деятельности по словоформам вроде бы как вопросов нет.
          В этом разделе Infovarius предложил попробовать универсализировать шаблоны словоизменений, и я попробовал взглянуть на эту проблему шире и попробовал осветить свое видение на этот счет. В частности сделал несколько пробных предложений. Однако часть из них (в частности именование шаблонов) не имеет совершенно никакого отношения к деятельности со словоформами.
          Просто раз мы не пришли к единому мнению на этот счет, а всем было бы лучше, если бы мы к этому мнению рано или поздно все-таки пришли, то почему бы собственно не обсудить это и не попытаться придти к какому-нибудь мнению (иначе как это еще можно сделать без обсуждения?) --Vitalik7 (обсуждение) 09:09, 1 декабря 2013 (UTC)
          • Если бы в этом разделе речь шла только об именовании шаблонов — я бы это еще понял (хотя и все равно считаю, что закрывать чужие незавершенные обсуждения по меньшей мере неэтично). Но ведь в этом разделе затрагиваются также те вопросы, на разработку которых сам же DonRumata в итоге выразил согласие (например, анализ шаблонов словоизменения с целью извлечения словоформ), и, как я писал выше, в разработке которых заинтересованы и другие уважаемые участники проекта. Поэтому совершенно не понятна цель необдуманного закрытия всего обсуждения целиком. Ведь это в какой-то степени блокирует уже начатую работу.
            DonRumata, если вы вдруг считаете, что деятельность по извлечению словоформ начинать преждевременно (прошу прощения, но мне до сих пор становится не совсем понятна ваша позиция), то обоснуйте свою точку зрения, я же в ответ обосную свою, другие участники выразят свои мнения. И мы найдем консенсус. Но это можно сделать только в обсуждении. Одновременно же и давать добро, и блокировать уже начатую работу — это выше моего понимания, и по меньшей мере некрасиво --Vitalik7 (обсуждение) 23:47, 1 декабря 2013 (UTC)
            Коллега, технические вопросы о реализации бота нужно решать после принципиального согласия большинства редакторов о целесообразности такой работы. Опишите предлагаемый вами план работ на странице Викисловарь:Организационные вопросы. После его поддержки, вы можете продолжить обсуждение реализации здесь. Don Rumata 08:30, 2 декабря 2013 (UTC)
            Я прошу прощения, но мне кажется вы просто придираетесь. Я уже опасаюсь писать большие многоуровневые сообщения, но тем не менее так мне кажется проще донести свою мысль (разложив ее по отдельным полочкам):
            • о предлагаемом плане работ я неоднократно писал в этом и соседних подразделах, и кратко, и подробно.
            • также мне показалось, что я нашел достаточную поддержку для того, чтобы хотя бы просто попробовать реализовать такой подход (целесообразность применения станет понятна после завершения работы над алгоритмом)
            • выбирая подходящий раздел для вопроса я руководствовался приведенными в них описаниями:
              1. технических вопросов (детали программирования, создание ботов, использование синтаксиса разметки, механизм функционирования шаблонов и категорий и т. п.).
                • вопрос затрагивает: детали программирования, создание ботов, а также механизм функционирования шаблонов
              2. организационных вопросов (структура и оформление Викисловаря, изменение статуса участников и страниц, претензии, разрешение конфликтов, действия относительно вандализма и т. п.)
                • вопрос НЕ затрагивает ни структуру, ни оформление Викисловаря (структура остается неизменной, предлагается лишь автоматизация того, что уже делается многими участниками вручную), единственный повод перехода в другой раздел — это наличие конфликта, который вы создали закрытием незавершенного обсуждения
            • вы по какой-то скрытой неясной причине против предлагаемой деятельности (либо против деятельности в принципе, либо против моего участия в ней)
            • на все конкретные замечания я постарался аргументированно отвечать
              • словоформы уже созданы в объеме порядка ста тысяч, т.е. вопроса в том, хранить ли их в Викисловаре — не стои́т
              • на поиск и на всплывающий список при вводе поискового запроса наличие словоформ не оказывает никакого отрицательного воздействия (наоборот — только плюсы)
              • тот факт, что я новичек в проекте не является помехой в использовании бота, если он окажется достойным, пройдет тщательную проверку участниками и получит поддержку сообщества
                (я надеюсь, что не нужно обосновывать тот факт, что, например, дизайнер, который хочет помочь проекту не обязан разбираться в деталях программирования шаблонов, и, к примеру, для того, чтобы добавлять толкования слов не обязательно разбираться в транскрипции МФА, каждый помогает проекту на своем уровне, кто чем может)
              • для реализации предлагаемого подхода НЕ нужно ни переименовывать шаблоны, ни коренным образом их перестраивать, об этом речь зашла лишь по ходу дела в рамках дополнительного свободного обсуждения
            • я не вижу особого смысла пытаться повторять это обсуждение в другом разделе (Организационные вопросы), т.к. на все ваши высказанные замечания — я аргументированно отвечал, а из-за наличия невысказанных — ситуация вряд ли изменится, вы являетесь уважаемым участником сообщества и к вашему мнению прислушиваются
            Итого, я остаюсь при своем мнении касательно того, что имеет место некоторый необоснованный произвол. Но ввиду того, что после закрытия обсуждения я не получил поддержки от других участников сообщества, наверное, допустимо считать, что я был не прав (по мнению этого сообщества).
            В этой связи дабы не усугублять конфликтную ситуацию я сверну свою деятельность по поводу формирования словоформ. Простите. --Vitalik7 (обсуждение) 14:02, 2 декабря 2013 (UTC)
            Коллега, не обижайтесь. Я так и не понял в чём ваше предложение. Хотите создавать статьи о омоформах? Создавайте. Хотите автоматизировать процесс поиска омоформ — пожалуйста, автоматизируйте. Вы затронули нетехническую тему «Словоформы как отдельные словарные статьи (редиректы) + переносы строк». В данном подразделе вы затронули вопрос именования шаблонов. Это вопрос изменения структуры. Вы предлагаете массово создавать статьи. На данный момент вы приняли участие в редактировании всего четырёх статей (ком,палочник, Богданович и Богдановић). В статье ком вашу правку отменили. Есть правило ВС:НББ. Ваш порыв понятен, но доверять вам флаг бота я боюсь. Don Rumata 08:22, 3 декабря 2013 (UTC)
            - Гм.. Забавно, но я в свою очередь точно также не могу понять ваше отношение к моей деятельности. С одной стороны вы вроде бы абсолютно не возражаете против того, чтобы я попробовал выполнить эту работу (и если она пройдет все проверки и будет одобрена сообществом, то применить ее к Викисловарю). С другой стороны, мне несколько раз показалось, что вы категорически против этого (возможно имеет место просто недопонимание)
            - Относительно именования шаблонов, их реализации и прочего — я согласен, что это обсуждение можно и нужно перенести в "Организационные вопросы", но категорически не согласен с тем, что из-за упоминания в этом разделе этой проблемы — нужно целиком закрывать весь раздел (содержащий в том числе незаконченные обсуждения, касательно той деятельности, которую вы неоднократно вроде бы одобрили).
            - Наверное, имеет место просто обычное недоразумение. Я не понял вас, вы не поняли меня. Я посчитал закрытие обсуждение признаком того, что соответствующая деятельность подвергается запрету (ведь как можно корректно продолжать деятельность без необходимого порой обсуждения?). И очевидно, что мне такой запрет показался очень неожиданным, необоснованным и неправомочным. Если дела обстоят именно так и имеет место взаимное недопонимание, тогда у меня большая просьба: либо раскрыть обсуждение (при этом я обещаю не касаться т.н. организационных вопросов, а продолжить обсуждение здесь только в рамках программирования бота и сопутствующих проблем или возможных вариантов, а для именования шаблонов и прочего — возможно в будущем создам вопрос в организационном разделе, а может кто-нибудь сделает это раньше меня), либо перенести это обсуждение в организационную ветку (либо полностью, что не совсем красиво, либо частично, что более правильно), при этом, если нужно, я могу сделать это самостоятельно, разделив технические и организационно-структурные моменты.
            - Касательно массового создания статей: во-первых, это не совсем близкое будущее, перед тем как это станет возможно, я волей-неволей изучу очень многие тонкости использования шаблонов, а, во-вторых, это создание статей на первом этапе (точнее сказать: на втором или третьем) подразумевает не полноценные статьи, а лишь ссылки на базовую форму и описание словоформы для омоформ (с помощью стандартных шаблонов). Поэтому мой статус новичка не является помехой для этого. Повторюсь, что к тому моменту, как потребуется вносить серьезные изменения в статьи я постараюсь перейти к следующему "статусу". Но даже если это формально не произойдет, сообщество само сможет принять решение, стоит или не стоит применять тот или иной реализованный подход. По большому счету, как проверенный участник может где-то случайно ошибиться, так и новичок может принести качественную пользу проекту.
            - По поводу правки ком я благодарен и понял свою ошибку. Это (отсутствие нужного опыта), кстати, является одной из причин, по которой я не тороплюсь начинать вносить правки в статьи (не смотря на то, что это формально необходимо, чтобы со временем выйти из статуса новичка). Предпочитаю начать с тех моментов, которые успею изучить в должной мере, и которые будут мне по силам. Со временем возможно смогу влиться и в другие фронты работ (и перестать формально быть новичком).
            - По поводу флага "бота" тоже не совсем понятно, ведь он у меня вроде бы уже и так есть. Однако уверяю, что не собираюсь вносить с помощью него правки в статьи (основное пространство) до тех пор, пока не будет выражена поддержка этих действий сообществом. На данном этапе планируется использовать его на пространстве личных подстраниц участника, в которых, как я понимаю, можно пробовать реализовывать любые идеи. --Vitalik7 (обсуждение) 16:15, 3 декабря 2013 (UTC)
            Я не вижу никакой деятельности, а вижу пространные рассуждения слабо относящиеся к задачам проекта. Если вам интересно поэкспериментировать с программами, то это лучше делать на testwiki: или test2wiki:. Don Rumata 23:16, 4 декабря 2013 (UTC)
            Странно, не заметил этого сообщения. Наверное, это из-за переноса этого обсуждения в другой раздел. По поводу testwiki ответил (так сложилось) на странице обсуждения Эла. По поводу того, что слишком много рассуждений — меня это тоже очень тяготит. Потраченное время можно было провести с куда бо́льшей пользой. В этой связи предлагаю следующее: выскажите, пожалуйста, все требования, которые вы предъявляете ко мне или к моей деятельности. Я, по возможности, постараюсь с ними согласиться. И на этом возможно конфликт будет исчерпан. --Vitalik7 (обсуждение) 21:02, 5 декабря 2013 (UTC)
        • Vitalik, я поддерживаю ваш порыв — если он воплотится в жизнь, то это будет существенное улучшение содержимого. Хорошо, что вы обсуждаете все детали и пробуете перед основным запуском. Удивился, что в основном пространстве вы, оказывается, неактивны. Это не всегда недостаток, но для начала просто необходимо поработать непосредственно со статьями, чтобы "погрузиться" в него. К тому же, для различных флагов (начиная с автопатрулируемого) есть формальные требования по минимуму правок в основном пространстве. --Infovarius (обсуждение) 10:02, 3 декабря 2013 (UTC)
          • Спасибо большое за поддержку! Я это очень ценю. Относительно основного пространства есть три обстоятельства. Во-первых, работа на его просторах требует определенного времени, которого у меня очень мало (причина: в реале совмещаю две разные работы), и если я потрачу всё свободное время на эти правки, то мне собственно просто не хватит времени на написание скриптов (то, в чем я могу принести бо́льшую пользу проекту). Во-вторых, чтобы вносить качественные правки и не ошибаться, нужно изучить и самостоятельно проанализировать очень много тонкостей, что требует, опять же, времени, которого мало (однако потом, возможно, смогу перейти и к этим задачам). В-третьих, возможных различных деятельностей в Викисловаре очень много, и мне кажется не обязательно становиться экспертом во многих из них, чтобы начинать те или иные действия; например, эксперт в МФА может вносить правки не разбираясь в принципах шаблонов этимологии, дизайнеру (или верстальщику), не обязательно разбираться в принципах МФА, а для того, чтобы добавлять толкования и примеры использования слов не нужно разбираться в деталях шаблонов словообразования, и прочее. Я попробовал начать с той ниши (или тех ниш), которые мне ближе/интереснее/понятнее. Как-то так :) --Vitalik7 (обсуждение) 16:15, 3 декабря 2013 (UTC)

Об использовании ботов[править]

Перенесено со страницы Обсуждение участника:Al Silonov#Участник:Vitalik7Bot

Коллега, извините, но я не очень понимаю какой деятельностью вы занимаетесь в Викисловаре. Вы не редактируете статьи, не занимаетесь технической поддержкой. Вот зачем вы создали в своём личном пространстве список слов из словаря Ефремовой, Лопатина и Букчиной? Вы начали править подстраницы в Индекс:Русский язык, вам не понравилось оформление. Вы подняли обсуждение Викисловарь:Технические вопросы#Оформление Индекса, составляемого вручную. Мы нашли компромиссный вариант и договорились оформлять индекс как на странице Индекс:Русский язык/А. И всё это закончилось ничем. Теперь у вас новое увлечение. Какой был смысл создавать эти страницы? Зачем они могут кому-то понадобится? Зачем они вам? Don Rumata 19:11, 5 декабря 2013 (UTC)

Коллега, я прошу прощения, но мне почему-то кажется, что если я очередной раз (либо кратко, либо подробно) опишу свою деятельность, то это мало чем поможет изменить ситуацию. Тот факт, что я нашел единомышленников и эти единомышленники являются администраторами — я думаю, должен говорить сам за себя.
Касательно списка слов из словарей — это начало той деятельности, о которой меня даже попросили (в частности, это формирование списка красных ссылок на основе существующих словарей), и полезность которой немного выше отметил уважаемый Эл (спасибо!). Закончилось это в тот раз "ничем" (летом), т.к. мне показалось, что моя деятельность сообществу Викисловаря неинтересна. И только благодаря тому, что некоторые участники вновь подняли эту тему (за что им отдельная благодарность) я снова вернулся к проекту. Планирую возобновить ту деятельность.
Касательно тех страниц, о которых вы спрашиваете, смысл в них был бы только при условии продолжения работы над словоформами. Общий их объем — полтора мегабайта, это по большому счету ничто (в век, когда гигабайты на серверах стоят копейки). Но если по какой-то причине они очень мозолят вам глаза, то можете их удалить, в них пока нет ценности, я просто планировал размещать там результаты постепенного продвижения по анализу шаблонов словоизменения. Правда я не совсем понимаю смысл этого удаления, ведь занимать объем на серверах они при этом все равно будут.
Если вы спустя некоторое время спросите, почему моя деятельность касательно словоформ и шаблонов словоизменения прекратилась, то ответом будет констатация того факта, что вы по какой-то причине не видите в ней смысла и не смотря на поддержку этой деятельности другими администраторами — все равно меня преследуете. Вот теперь внезапно перекинулись на списки слов из словарей, они вам тоже почему-то не нравятся. Я, конечно, так не думаю, но складывается впечатление, что вы не успокоитесь, пока я не уйду из проекта. Извините, обидеть не хотел.
Отдельно прошу прощения у Эла за то, что на его странице обсуждения продолжается наш немного иррациональный конфликт. Выражаю надежду, что он (этот конфликт) закончится в скором времени. --Vitalik7 (обсуждение) 20:20, 5 декабря 2013 (UTC)
Виталик (не сочтите за фамильярность, таково имя вашей учетной записи), мне так кажется что вы используете этот проект в каких-то собственных целях. Вы открываете многословные обсуждения, отвлекаете всех от серьёзной работы по наполнению содержания словаря. Безусловно, нужно обсуждать важные вопросы касающиеся, например, внесения омоформ, но это чисто организационные вещи. Всё остальное касается только указания источников этих омоформ. Если у вас источников нет, то и обсуждать тут нечего. Сам Викисловарь источником для себя быть не может по многим причинам. Если вам просто интересно попробовать поэкспериментировать с ботами, то testwiki: для этого самый подходящий проект. Пока я не вижу никакого конструктивного вашего участия. Если вы откажитесь от ваших намерений, то меня это лично не расстроит. Проект добровольный. У нас основатели его покидали, и активные администраторы тоже. Ваше участие пока минимально. Теперь несколько слов по-поводу вашего впечатления, что я имею какое-то к вам предвзятое отношение. Это не так. Я только хочу направить вашу активность в правильное русло. Если вы действительно желаете помочь вносить омоформы, то начните для начала делать это руками. Затем возьмите базу форм слов из словаря Зализняка (см. Обсуждение участника:Vesailok/archive2011#Нужен список русских слов в одном файле), пройдитесь по ней и определите пары. Создайте список статей для редактирования или создания. Сделайте десяток правок с помощью w:ВП:АВБ. Попробуйте повторить этот результат вашим ботом. И просите дать добро на массовые изменения. И не нужно никаких публичных обсуждений. Кстати, Vesailok может помочь освоить бота. Don Rumata 21:13, 5 декабря 2013 (UTC)
Отвечу, если позволите, по пунктам:
  • >> Виталик (не сочтите за фамильярность, таково имя вашей учетной записи)
    Я сам выбрал этот ник, так что обращение через Виталик вполне приемлемое :) — лишь бы не "Vitalik7"
  • >> мне так кажется что вы используете этот проект в каких-то собственных целях.
    Могу вас заверить, что никаких собственных целей я не преследую (если не считать целью — развитие Викисловаря как такового).
    Дабы убедить вас в этом, могу рассказать, как так получилось, что я пришел в этот проект.
    • Началось все с того, что я решил разработать игру "Быки и коровы" (в ее вариации, когда загадываются не случайные цифры, а существующие слова), очень любил играть в нее в детстве. При этом игра происходит между двумя игроками (каждый загадывает слово и игроки по очереди делают ходы по отгадыванию слова противника, выигрывает тот, кто угадал первым). Получилось сделать эту игру в виде веб-сайта, однако пока что участвовать онлайн в ней могут только два человека (для них ведется история игр и статистика). Было много задумок, в частности — многопользовательский режим, а также возможность игры с компьютером. Что касается компьютера, то тут может быть либо простое загадывание слова компьютером (при этом человек его отгадывает), либо в том числе и игра компьютера по отгадыванию слова, загаданного человеком. В любом случае для этого нужна была база слов определенной длины (из 3, 4, 5, 6 и т.п. букв) и определенного типа (существительные в им. падеже, ед. числе).
    • Изначально я к этой задаче подступился следующим образом, начал искать в интернете существующие словари. Каково же было мое удивление, когда выяснилось, что раздобыть нормальный словарь — очень непросто. Более менее неплохая подборка нашлась на сайте speakrus.ru, однако немалая часть тех словарей оставляет желать лучшего (очень много моего труда было вложено по автоматизации доставания слов из неструктурированного плохо отсканированного текста и дальнейшая многоэтапная вычитка с оптимизацией алгоритма либо исправления опечаток прямо в тексте). Далее я обнаружил сайт academic.ru и написал скрипты по извлечению словарных статей из него. К нему, казалось бы, больше доверия, ведь его информацией пользуются даже Яндекс.Словари. Однако не все так радужно и он также изобилует опечатками или просто кривостями, однако в гораздо меньшей степени, чем отсканированные неправильно тексты. При этом, есть еще один забавный момент, есть много сайтов, которые гугл выдает на первых страницах, на которых используется необработанный неправильно отсканированный текст! Подробнее, о том, с какими трудностями я столкнулся в этой деятельности, как некоторые из них преодолел, а также результаты этой деятельности могу выложить позже, думаю они будут многим интересны. Собственно в итоге я взял за основу те словари, которые вызывали наибольшее доверие (их в принципе оказалось немало), прогнал извлеченные слова через утилиту mystem, с помощью которой удалось получить часть речи для каждого слова, а также (что было для меня важно), частоту встречаемости каждого слова (mystem также выдает и эту информацию). Частота нужна была для того, чтобы компьютер с "высоким" уровнем сложности загадывал непростые слова, а с "легким" уровнем — более распространенные.
    • Немногим позже я наткнулся на Викисловарь, задумался о том, как можно извлечь из него список слов. Сделал это с помощью автоматической загрузки html-страниц категории Категория:Русский_язык, с дальнейшим их парсингом и извлечением слов. Теперь, когда я научился использовать библиотеку pywikibot, в которой то же самое можно сделать всего несколькими строчками кода, старый подход кажется очень тяжеловесным, но он был. После этого я заметил Индекс:Русский_язык, обратил внимание, что он не обновлялся очень давно и подумал, что было бы неплохо применить свои наработки со словарями (собственно извлеченная база новых слов) для этого Индекса, тем самым значительно обогатить его. Я начал бурную деятельность по этому поводу (летом, в августе, во время отпуска) и настолько увлекся, что даже позабыл о своей игре "Быки и коровы".. Однако, лето подошло к концу, моя деятельность хоть и была изначально поддержана участниками, но у меня сложилось ложное (как выяснилось) впечатление, что из некоторого молчания на мои сообщения следует тот факт, что интереса к моей деятельности у сообщества нет. Лето кончилось, начались трудовые будни и я о Викисловаре забыл.
    • Однако в конце октября тема была вновь поднята, мне пришло личное сообщение от участника Petroglyph, который интересовался моей деятельностью и его в той или иной степени поддержало сразу несколько других участников (Cinemantique, Infovarius, soshial — на моей СО или в технических вопросах). Однако, ноябрь был особенно тяжелым для меня месяцем (пик преподавательской нагрузки, которая на этот период заключалась в трех разных сферах, при этом совмещать ее еще и с работой программиста очень непросто). В этой связи уделить много времени одному из своих хобби (можно это назвать как "программирование в свое удовольствие") не получалось, но тем не менее редкими свободными вечерами или на выходных иногда удавалось медленно продвигаться в этом направлении. Благодаря этому стала все-таки возможной автоматическая генерация страниц со списками слов, при этом учитывающая ряд тонкостей, но о них также напишу подробнее потом. Так сложилось, что временно завершилась эта деятельность добавлением словарей Лопатина, Ефремовой и Букчиной с помощью бота, автоматически (при этом дополнительно отладил и оптимизировал этот механизм). В частности также для словарей Лопатина и Ефремовой был проведен некоторый сравнительный анализ для разных источников (speakrus.ru и dic.academic.ru), однако результаты я пока выложить не успел.
    • В середине ноября я, на свою беду, встретил словари со словоформами (Зализняк, Хаген) и спросил о целесообразности использования словоформ в Викисловаре, исследовал этот момент подробнее, выяснил, что вполне можно автоматизировать добавление недостающих словоформ на основании шаблонов словоизменения, предложил свою помощь в этом деле, "и понеслась".. Дальнейшее вы уже знаете, моя деятельность вызывала некоторый резонанс, у нас с вами возникло недопонимание, которое переросло в небольшой конфликт.
Собственно я это все рассказал по двум причинам: во-первых, чтобы показать, что никаких других целей, кроме цели помочь развитию интересного и полезного проекта Викисловаря — у меня просто нет, а, во-вторых, так как, к счастью, мы сейчас находимся на странице моего обсуждения и, стало быть, никто не обязан читать мою историю, то получается, что отвлекать от работы я никого не буду.
  • >> Всё остальное касается только указания источников этих омоформ. Если у вас источников нет, то и обсуждать тут нечего.
    Вот тут позвольте не согласиться. Источники раздобыть я могу, и не только источники, но и нужные параметры словоформы и базового слова, это все относительно легко извлекается благодаря отличной развитой системе шаблонов словоизменения, однако по той же самой причине (однако теперь имею в виду некоторую не-единообразность системы шаблонов словоизменения), чтобы извлечь эту информацию нужно приложить немало усилий по рутинной проверке и выверке всех шаблонов и сопутствующей этому универсализации анализирующего алгоритма. Однако, чтобы продолжать эту деятельность очень необходима возможность обсуждения возникающих проблем или вопросов.
  • >> Сам Викисловарь источником для себя быть не может по многим причинам.
    Опять, извините, не согласен. Очень даже может: благодаря той же самой причине — развитая система шаблонов словоизменения.
  • >> Если вам просто интересно попробовать поэкспериментировать с ботами, то testwiki: для этого самый подходящий проект.
    Нет, нет и нет. "Просто" экспериментировать с ботами мне не нужно. Т.е. я хочу сказать, что цели "просто попробовать" у меня нет. Я уже довольно неплохо разобрался с соответствующими механизмами. И автоматическое создание страниц со списком слов из популярных словарей — тому доказательство. Я не утверждаю, что знаю эту тему досконально, но чтобы выполнять прикладные задачи повышенной сложности — этого вполне хватит. А возникающие вопросы будут решаться по ходу дела. И соответственно я думаю, что вполне понятно, что testwiki по этой причине мне пока не нужен. Но за наводку — все равно спасибо! :) Иногда это может пригодиться.
  • >> Пока я не вижу никакого конструктивного вашего участия.
    Гм.. Вы — не видите, я — вижу. Говорить за себя мне бессмысленно, лучше пусть скажут другие участники, которые также видят в моей деятельности потенциальную пользу. К сожалению, принести фактическую пользу в полном объеме пока просто не успел, но надеюсь, что у меня все-таки будет для этого возможность.
  • >> Если вы откажитесь от ваших намерений, то меня это лично не расстроит. Проект добровольный.
    Я не отказываюсь от своих намерений. Я лишь считаю правильным на некоторое время их заморозить. По крайней мере до тех пор пока у нас с вами не получится достичь взаимопонимания.
  • >> У нас основатели его покидали, и активные администраторы тоже. Ваше участие пока минимально.
    Я пока не собираюсь покидать проект, так как вижу, что моя деятельность будет здесь полезна и нужна. Если я все-таки вынужден буду уйти из проекта (что вряд ли), то я очень расстроюсь, по двум причинам. Первая: это действительно очень жаль вложенного труда, не хочется, чтобы все это оказалось зря, впустую. Вторая причина: лично для меня это будет признаком того, что проект идет в немного неправильном направлении. Многие участники согласны с тем, что нам нужны новые люди. Вики-проект обладает колоссальнейшим потенциалом, и нельзя просто так отказываться от помощи новых участников. Википедия с этим справляется, у Викисловаря, конечно, своя специфика, работы очень много, наслышан и о вандализме, и о неквалифицированных правках, и о многочисленных организационных вопросах, но все равно считаю, что новые люди нам очень нужны. И если бы так сложилось, что меня вынудили бы проект покинуть, то лично мне было бы очень грустно, что открытый свободный проект такое допускает. Повторюсь, что это только мое личное мнение. Все мы люди разные, и у всех могут быть разные мнения, к тому же я многого могу не знать, не понимать. Но мое видение на данный момент именно такое.
  • >> Теперь несколько слов по-поводу вашего впечатления, что я имею какое-то к вам предвзятое отношение. Это не так. Я только хочу направить вашу активность в правильное русло.
    Тогда я уверен, что мы так или иначе сможем достичь взаимопонимания. И очень на это надеюсь.
  • >> Если вы действительно желаете помочь вносить омоформы, то начните для начала делать это руками.
    Да, спасибо, это замечательная мысль. Несомненно, я попробую это сделать руками. Однако с некоторой оговоркой. На мой взгляд это будет иметь смысл на том этапе, когда будет извлечена база словоформ с их параметрами и бот будет иметь возможность генерировать соответствующий вики-текст. Дабы мне правильнее понять и уразуметь все тонкости, каковые могут при этом возникнуть, действительно очень полезно и правильно попробовать вручную внести соответствующие изменения. Либо же, что более разумно, сгенерировать вики-текст ботом для одной определенной страницы, вычитать предлагаемый им результат и если он вполне адекватен, то внести его вручную как свой. После этого моя правка будет проверена сообществом. Если никаких ошибок и возражений не будет, можно двигаться дальше. Например, выложить где-нибудь вики-тексты, которые бот сможет генерировать (не все, а некоторую достаточную выборку) и если и в ней не будет найдено никаких ошибок или недочетов, то тогда уже можно просить у сообщества разрешение на массовые изменения.
  • >> Затем возьмите базу форм слов из словаря Зализняка (см. Обсуждение участника:Vesailok/archive2011#Нужен список русских слов в одном файле)
    Очень забавно, но именно с этого всё и началось. То есть не с той самой страницы, конечно, а с того, что я нашел в интернете несколько словарей, содержащих словоформы. И моей следующей мыслью было, а как с ними обстоят дела в Викисловаре. Ну а дальше, вы знаете..
  • >> пройдитесь по ней и определите пары. Создайте список статей для редактирования или создания.
    Тоже согласен, интересная мысль. Однако мне казалось более правильным начать именно со словоформ Викисловаря. Ведь в иных словарях, во-первых, будут новые слова (отсутствующие в ВС), и, во-вторых, будет отсутствовать огромное количество слов, уже существующих в ВС). Т.е. применять их результаты (найденные омоформы с параметрами) в ВС будет очень неразумно, бессмысленно. Все равно нужно будет сперва решить задачу извлечения словоформ и омоформ для всех слов Викисловаря и только после этого станет возможным адекватное применение совместных (ВС + иные словари) результатов в Викисловаре.
  • >> Сделайте десяток правок с помощью w:ВП:АВБ.
    Неоднократно натыкался на этот полезный инструмент. Но не пробовал. Не совсем пока понимаю, чем таким (принципиально новым или просто другим) он может помочь?
  • >> И не нужно никаких публичных обсуждений.
    А как быть, если возникают некоторые вопросы или спорные/проблемные моменты? Мне кажется, что лучше заранее уточнить и выяснить все ньюансы, чем если потом окажется, что я в корне был не прав или работа в принципе не нужна. К тому же, неоднократно встречал на справочных страницах Викисловаря, что обсуждение является очень важным элементом вики-проекта.
  • >> Кстати, Vesailok может помочь освоить бота.
    Имеется в виду w:ВП:АВБ? Или в принципе программирование ботов?
Прошу прощения за нелаконичность моего ответа. Но это, наверное, моя слабость. Стараюсь всеобъемлюще и всесторонне подать информацию, при этом крохи действительно важного могут затеряться среди огромного текста. --Vitalik7 (обсуждение) 00:15, 6 декабря 2013 (UTC)
Этого я и боялся. Коллега, ещё раз прошу вас прислушаться к моим словам. Не нужно комментировать мой текст. Не нужно устраивать дискуссии. Если вам нужен совет, вам помогут опытные участники. Но для начала прекратите болтать и начните работать. Сейчас создание омоформ имеет самый низкий приоритет. Их описывают, но заодно с основной задачей. w:ВП:АВБ это удобный инструмент для автоматизации рутинных операций, не требующий знания языков программирования. Им пользуются практически все, кому требуется выполнить массовые правки в википроектах. Викисловарь нельзя использовать для наполнения Викисловаря. Во-первых это открытый проект, редактируемый любителями. Тут огромное количество ошибок и неточностей, не учитывая намеренного вандализма, который непрерывно изливается как из рога изобилия на страницы Викисловаря носителями великого и могучего языка. А во-вторых, есть правило ВС:ПРОВ, которое требует основываться на АИ. Так что не трудитесь вытаскивать формы слов из Викисловаря. Вы не получите и доли того, что уже есть в словаре Зализняка. Я бы очень просил вас следовать ВС:НББ. Если вы будете редактировать хотя бы по одной статье в день или отменять по одной вандальной правке, это уже будет большая помощь проекту. Don Rumata 04:08, 6 декабря 2013 (UTC)
Раз уж вы написали сообщение — я вынужден ответить. Постараюсь очень кратко. С некоторыми вашими утверждениями я не согласен, но комментировать по вашей просьбе не буду. За пожелания и рекомендации — благодарен, ваша позиция мне вполне понятна, но и мою — также прошу понять: каждый участник вносит вклад по своим силам, способностям и интересам, у каждого свой путь. Dixi. Если вы также считаете конфликт исчерпанным, то на мое сообщение можно не отвечать. --Vitalik7 (обсуждение) 07:36, 6 декабря 2013 (UTC)
Проект добровольный, вы вольны участвовать так, как считаете возможным. Активным новичкам всегда рады. Активных редакторов, вносящих вклад каждый день тут не много. Коллектив дружный. Вливайтесь. Don Rumata 10:57, 6 декабря 2013 (UTC)

Бот (1)[править]

Виталик, может приостановить бота и показать, что дальше с этим делать? --- Vesailok 22:13, 15 декабря 2013 (UTC)

Бот сейчас просто вносит в Викисловарь текущие результаты (просто всевозможные извлеченные словоформы: и уникальные, и в виде омоформ — вперемешку).
При необходимости с помощью бота можно применить эти результаты к основному пространству. Но перед этим нужно, во-первых, проверить правильность этих результатов. Во-вторых, четко поставить задачу и добиться одобрения сообщества, как я понимаю.
Например, для начала, я могу сделать список только тех словоформ, которые на данный момент не имеют омоформ в Викисловаре и таким образом могут быть добавлены в виде редиректа на базовую форму (плюс шаблон словоформы). Также я могу добавить такой шаблон словоформы к уже существующим словоформам-редиректам. Это сделать довольно легко и на этот шаг легче получить одобрение сообщества.
Далее можно подумать об омоформах, однако перед этим уже предстоит немало работы (и обсуждение спорных моментов, и соответствующая реализация бота). --Vitalik7 (обсуждение) 23:13, 15 декабря 2013 (UTC)
А мне кажется, лучше начать с омоформ. Во-первых, их меньше, и на их добавление будет проще согласиться (хотя предварительной работы будет больше, конечно). Во-вторых, нет риска сделать перенаправление там, где потребуется полноценная страница (это, в общем-то, некритично, но такие опасения высказывались). В-третьих, увеличение количества статей (не представляю, правда, какое количество там ожидается). Только два нюанса: 1) разнопадежные омоформы одной и той же лексемы не достойны страницы (то есть достойны перенаправления), например именительный и винительный падежи множественного числа какого-то слова; 2) сначала лучше взять омоформы несуществующих страниц, то есть бот только создаёт статьи-дизамбига, но не дополняет статьи (меньше риска).--Cinemantique (обсуждение) 01:56, 16 декабря 2013 (UTC)
"омоформы несуществующих страниц" - это уже кстати было сделано, с тех пор много разорванных редиректов, которые нуждаются в исправлении путём создания настоящих статей (targets). --Infovarius (обсуждение) 06:22, 16 декабря 2013 (UTC)
По поводу "омоформ несуществующих страниц" мне кажется Cinemantique имел в виду не "несуществующие статьи базовых форм", а сами статьи омоформ, которые просто еще не созданы. Т.е. предлагается в первую очередь создавать те страницы-омоформы для существующих базовых форм, которые еще не были созданы до этого. А уже потом переходить к редактированию (дополнению) существующих страниц-омоформ. В моих текущих результатах в принципе не может быть "несуществующих базовых форм" по той причине, что результаты получены не из внешних источников, а из самого Викисловаря. --Vitalik7 (обсуждение) 10:33, 16 декабря 2013 (UTC)
В целом, так, но под второй очередью я имел в виду редактирование полноценных статей, ну и существующих дизамбигов тоже, если потребуется. Но это, может, и не входит в планы.--Cinemantique (обсуждение) 10:44, 16 декабря 2013 (UTC)
Гм.. А в чем принципиальная разница между "полноценной статьей" и "статьей-дизамбигом"?.. Если я правильно понимаю, то их структуры полностью идентичны? Просто в любой статье могут быть либо разделы с массой подзаголовков (морфология, семантика и пр.), либо разделы с описанием словоформы, верно? --Vitalik7 (обсуждение) 12:39, 16 декабря 2013 (UTC)
Касательно того, какие были опасения — мне показалось, что основная причина была просто в том, что я "новичок" и если бы эти вопросы поднял более "статусный" участник, то конфликта скорее всего бы не было.
Если по существу, то получается, что есть два направления: массовое добавление редиректов и работа над омоформными статьями. Если я правильно понял, то для Vesailok гораздо важнее первая задача, а для вас — вторая.
В какой-то степени можно сказать, что первая задача включается во вторую. Т.е. для обоих задач нужно сначала: исправить все ошибки/недочеты связанные с формированием словофором, добавить обработку других частей речи и пр. После этого первую задачу (редиректы) можно будет без особых проблем сразу и запускать (если будет необходимость и одобрение сообщества). Над второй задачей остается еще дополнительная работа (плюс есть несколько спорных вопросов относительно того, как должны выглядеть страницы-омоформы, что считать омоформами и прочее, о них я напишу позже). В принципе обе эти задачи можно решать параллельно (т.е. работать над второй не дожидаясь решения первой), что я и постараюсь в виду того, что ко второй задаче есть интерес. --Vitalik7 (обсуждение) 12:39, 16 декабря 2013 (UTC)

Бот (2)[править]

Вы чем редактируете страницы? Через pywikipedia? --Infovarius (обсуждение) 13:25, 16 декабря 2013 (UTC)

Да, верно. pywikipediabot, Очень удобный инструмент --Vitalik7 (обсуждение) 13:39, 16 декабря 2013 (UTC)
Если будет необходима помощь в освоении — с удовольствием помогу --Vitalik7 (обсуждение) 22:59, 16 декабря 2013 (UTC)
У меня есть вопрос насчёт бота: каким образом вы редактируете страницы, которые невозможно перечислить по категориям? Например, найти все сущ. и глаголы и убрать параметр склонения |show-text=1, который больше нигде не используется. Как бы ты это сделал? — soshial@ 22:01, 23 декабря 2013 (UTC)
Тут есть некоторая хитрость, о которой я упоминал в этой теме.
Дело в том, что у меня все-таки получилось в итоге:
  • загрузить в локальную БД все слова Викисловаря (и некоторую информацию о них: полное содержимое статей, дата последнего изменения, флаг редиректа), вышло около 1,5 Гб!
  • а также наладить легкий механизм автоматического обновления всех данных за счет информации из свежих правок
Таким образом я могу проанализировать абсолютно все словарные статьи (с их актуальным содержимым) совершенно не обращаясь при этом к серверу Викисловаря.
Конечно, это получается не так уж и быстро (если необходим полный перебор, то в зависимости от задачи может занять от 15 минут до получаса), но учитывая какой объем приходится обрабатывать скрипту — это очень неплохой результат!
Если бы для этого пришлось использовать механизм категорий или перебор слов по полному индексу, то, во-первых, это заняло бы на много порядков больше времени (изначально дамп формировался, т.е. простая загрузка страниц, аж в течение нескольких дней), а, во-вторых, это была бы дополнительная нагрузка на сервера Викисловаря.
Теперь по сути вопроса:
  • в общем случае — если нет возможности использовать выборку по категории (pywikibot.Category(site, u"Категория:Имя категории")), то пришлось бы делать выборку абсолютно всех страниц (AllpagesPageGenerator()) с последующей фильтрацией по заголовку и содержимому (например, наличие соответствующего языкового шаблона или шаблона словоизменения, который идентифицирует нужную часть речи)
  • дальше по обстоятельствам: если нужно абсолютно везде убрать строку "|show-text=1", то достаточно лишь произвести ее замену на ""
  • если же это изменение нужно применить только для определенных шаблонов определенного языка, то тогда:
    • я бы сначала с помощью регулярного выражения достал текст всего вызова соответствующего шаблона(ов) (как и приходилось действовать при формировании словоформ)
    • далее удалил бы из этого текста "|show-text=1"
    • и после этого произвел бы замену в исходной строке статьи изначального текста шаблона на измененный (без строки "|show-text=1")
    • и так для всех вхождений подходящих шаблонов в текст статьи
  • Не сильно запутанно получилось описать? Иногда легче просто код показать..
  • Но! Благодаря тому, что у нас уже есть БД со всеми словами, то вместо первого шага — достаточно лишь пройтись по всем записям в этой БД и применять результат к Викисловарю только в случае успешной замены.
Кстати, у меня была задумка загрузить эту БД на сервер в Интернете и там же попробовать разместить скрипт по автоматическому ее обновлению.
Тогда можно было бы когда-нибудь в будущем сделать автоматически запускаемых ботов (с определенной периодичностью) для определенных рутинных задач (либо по проверке нового контента, либо по обновлению определенных списков, и т.п.)
При этом если другим разработчикам будет нужен доступ к этой БД, то я готов его предоставить (логин/пароль доступа к mysql)
Кстати, а на каком языке программирования пишешь? Знаешь ли Python? --Vitalik7 (обсуждение) 23:06, 23 декабря 2013 (UTC)
Спасибо за подробное объяснение. На Python пишу сносно и сам сумел воспользоваться pywikipedia несмотря на их пертрубации с модулями/переписываниями и т.п., дамп скачал но не смог доковыряться до полутора гигов :( А как ты последние обновления скачиваешь-то? — soshial@ 12:59, 24 декабря 2013 (UTC)
По поводу Python и pywikipedia — это здорово! У меня тоже с последним в своё время возникли трудности.
Касательно скачивания и применения последних обновлений к БД могу изложить cвой код. Однако ввиду того, что с БД я работаю через django, то участки кода по работе с БД я пока заменю на соответствующие комментарии. Если же у тебя получится и с django подружиться, то сможем легко обмениваться исходниками.
from pywikibot.pagegenerators import RecentChangesPageGenerator
from pywikibot.exceptions import NoPage

last_updated = ...  # получаем из БД дату последнего обновления
g = RecentChangesPageGenerator(end=last_updated)  # объект из pywikibot для получения свежих правок вплоть до даты last_updated
for item in g:  # пробегаем по всем элементам в свежих правках
    title = item.title()  # получаем заголовок текущего элемента
    if ':' in title:  # если в заголовке присутствует двоеточие,
        continue      # то он нас не интересует, т.к. это правка служебной страницы или страницы обсуждения
    page = ...  # пытаемся найти в таблице "page" запись с заголовком title, если нету — создаем
    try:
        edited = item.editTime()  # получаем дату правки текущего элемента
        ...  # далее у меня идет код по некоторому преобразованию этой даты, но в общем случае может и не понадобиться
    except NoPage:  # если возникло такое исключение, это значит, что страница была удалена
        ...  # создаю в таблице "page_deleted" запись с данными об удаленном элементе
        page.delete()  # удаляю текущий элемент из таблицы "page" и из всех связанных таблиц
        continue  # переходим к следующему элементу
    # если мы дошли до этих строк, значит никаких исключений не возникало и статья присутствует
    content = item.get(get_redirect=True)  # достаем содержимое статьи (при этом если это статья-редирект, то нас все равно интересует исходный текст)
    content = remove_utf8mb4(content)  # это я написал функцию, которая удаляет очень редкие случаи использования т.н. utf8mb4 (в общем случае может не понадобиться)
    redirect = item.isRedirectPage()  # получаем информацию о том, является ли страница редиректом
    ...  # создаем или обновляем данные в таблицах "page_content", "page_edited" и "page_redirect"

Вот собственно и всё. Буду очень рад, если кому-то этот код пригодится. --Vitalik7 (обсуждение) 22:14, 25 декабря 2013 (UTC)

Пришлось доработать алгоритм, чтобы правильно учитывать переименования страниц. Для этого нужно дополнительно пробегаться по LogEntryListGenerator и фильтровать элементы по MoveEntry. --Vitalik7 (обсуждение) 03:13, 18 января 2014 (UTC)

Длина слов etc.[править]

Виталя, добрый день. Скажите, а вы сильно заняты? Мне тут такая идея пришла в голову: проверить все статьи на наличие и заполненность шаблона {{длина слова}}. Вы не могли бы собрать эти данные с помощью бота? Также интересует возможность расстановки ботом языкового параметра в шаблоны помет (то есть вместо {{разг.}} — {{разг.|ru}} в зависимости от того, к какому языку относится раздел).--Cinemantique (обсуждение) 14:29, 20 декабря 2013 (UTC)

По поводу занятости — вопрос непростой. Сейчас занят действительно сильно, но иногда появляется свободное время.
Касательно длины слова, помет и прочего — на самом деле я и сам хотел когда-нибудь нечто подобное предложить, но опасался повторения конфликтной ситуации как со словоформами.
Если по существу — то с удовольствием напишу такого бота, но есть ряд вопросов:
  1. Что считать "заполненностью" шаблона {{длина слова}}? Если я правильно понимаю, всего возможно только два варианта его использования?
    • {{длина слова|7|lang=ru}}
    • {{длина слова|7}}этот вариант нужно считать "наличием", но "незаполненностью"?
  2. Если я правильно понял, то этот шаблон {{длина слова}} может (и должен) использоваться отдельно для каждого языка, представленного в статье?
    Считать ли наличием/отсутствием случай, когда для одного языка в статье шаблон используется, а для другого — отсутствует?
  3. Что такое шаблон {{subst}} и как интерпретировать следующие случаи:
    • <includeonly>{{subst:длина слова|lang=grc}}</includeonly>
      явно какой-то смысл заложен, но не совсем пойму какой (здесь: δεσμός, δέρμα, βδέλλα, βήμα)
    • {{subst:|lang=pl}} - а это просто какая-то ошибка? (здесь: gardło)
  4. Допустимо ли использовать шаблон {{длина слова}} для словарных статей, состоящих из нескольких слов? Если вдруг да, то пробел при этом символом слова не считается?
  5. Как считается длина слова, если в нем содержится дефис?
  6. Как считается длина слова, если в нем содержатся отличные от букв символы? (например: а/я)
  7. Касательно помет, полный их список можно найти здесь: Категория:Шаблоны помет?
  8. Применить добавление языка нужно для всех помет или только для некоторых?
Навскидку прошелся, получилось около 100 тысяч статей, у которых нет шаблона {{длина слова}} (правда там в том числе и статьи, состоящие из нескольких слов).
В любом случае, мне кажется, имеет смысл попробовать поручить добавление недостающих шаблонов боту? --Vitalik7 (обсуждение) 18:24, 20 декабря 2013 (UTC)
Для информации: словарных статей с пробелами и отсутствующим шаблоном {{длина слова}} — около 12 тысяч. --Vitalik7 (обсуждение) 18:54, 20 декабря 2013 (UTC)
Длина слова - количество символов в слове (не в словосочетании), lang=ru должно присутствовать на том месте, где у нас без параметра lang (это связано с тем, что для русского языка раньше не было параметра, потом сообщество высказалось за параметр lang=ru). Если есть пробелы, то это уже не одно слово, и шаблон ставить не стоит. Subst: означает подставить результат выполнения следующего шаблона. Вопросы остались? --- Vesailok 20:04, 20 декабря 2013 (UTC)
Спасибо за информацию. Да, вопросы еще есть, вы ответили только на 1-й и 4-й. --Vitalik7 (обсуждение) 20:24, 20 декабря 2013 (UTC)
Гм, прошу прощения. Еще на 5 и 6, если имелось ввиду, что дефис, слеш и прочие символы учитываются при подсчете. Это так? --Vitalik7 (обсуждение) 20:30, 20 декабря 2013 (UTC)
Эту деятельность надо бы вообще от глаз людских спрятать. Длину -- внутрь заголовочных шаблонов типа Шаблон:-ru-, язык в пометах -- через механизм Extension:Variables (если подключить это расширение, то в Шаблон:-ru- можно будет добавить установку значения "текущий язык такой-то", а потом везде, где нужно, просто вытаскивать значение текущего языка; а еще оно позволит автоматически посчитать число межъязыковых омонимов)...
И считать длину не в непонятно каких символах (в которых апостроф почему-то идет аж за 5 единиц), а именно в буквах. -- M. G. J. (обсуждение) 20:46, 20 декабря 2013 (UTC)
Замечательные идеи, мне очень нравятся. Возможно стоит поместить запрос в организационных или технических вопросах на включение этого расширения (Extension:Variables)?
Относительно длины слова вы, как специалист в области шаблонов, сможете внести соответствующие правки в заголовочные шаблоны? В таком случае с помощью бота достаточно будет просто удалить везде использование шаблона {{длина слова}} как более не нужного.
Относительно помет также стоит предложить озвученную идею на общее обсуждение. И если ее реализовать, то боту при этом останется только удалить везде использование языковых параметров в пометах. --Vitalik7 (обсуждение) 21:19, 20 декабря 2013 (UTC)
Про длину слова: ее считает не сам шаблон, а функция на языке Lua, а я с ними пока не работал. -- M. G. J. (обсуждение) 09:18, 21 декабря 2013 (UTC)
Пробую вникнуть в дебри реализации шаблона {{длина слова}}...
Выяснил, что шаблон {{длина слова}} использует шаблон {{Str len}}, который использует функцию LUA string.len, которая вроде вполне работает адекватно с апострофами: {{Str len|Слово'с'апострофами}} → 19 (если последние записываются НЕ через HTML-мнемоники, а для заголовков статей это именно так)
Но остается вопрос: тот факт, что сейчас для длины слова считаются именно ВСЕ символы (и дефисы, и прочие специальные) — было ли принято такое решение и считать ли это правильным? --Vitalik7 (обсуждение) 19:39, 21 декабря 2013 (UTC)
Ура! Кажется что-то получилось!
Это я про идею M. G. J. помещения шаблона {{длина слова}} внутрь заголовочных шаблонов типа {{-ru-}}.
К самим шаблонам я изменения не применял (т.к. новичок в этом деле и лучше сначала переспросить у более опытных товарищей), но тщательно реализованную идею проверил и протестировал.
Собственно, достаточно добавить в шаблоны типа {{-ru-}} такую строчку:
<includeonly>{{#ifeq:{{Str find|{{PAGENAME}}| }}|-1|{{длина слова|{{Str len|{{PAGENAME}}}}|lang=ru}}|}}</includeonly>
где вместо "|lang=ru" использовать соответствующий язык
Если идея будет одобрена, то я могу добавить эту строчку (с изменением на соответствующий язык) во все заголовочные шаблоны автоматически с помощью бота.
Пару слов о самой строчке:
С помощью шаблона-функции {{Str find}} проверяется есть ли в заголовке пробел и если его нету (то есть было возвращено -1), то применяется вставка шаблона {{длина слова}} с первым параметром — вычисленным значением длины заголовка (с помощью {{Str len}}) и вторым параметром — языком (который фактически взят из соответствующего заголовочного шаблона).
Результаты тестирования (почему это действительно работает):
Был создан временный шаблон (с целью тестирования идеи): Участник:Vitalik7/Песочница/проверка_включения_длины_слова.
В него добавлена вышеозначенная строчка. Аналогичное действие можно произвести с заголовочными шаблонами, а этот временный шаблон потом просто удалить.
Этот шаблон был вставлен в две статьи (специально брал редкие, почти никем не тронутые и при этом не имеющие еще шаблона {{длина слова}}): Гонам и далеко пойти.
При этом к первой статье автоматически применилась категория Категория:Слова из 5 букв/ru, а ко второй ничего не применилось.
То есть идея работает. Что скажете? --Vitalik7 (обсуждение) 21:27, 21 декабря 2013 (UTC)
Вместо того, чтобы добавлять строчку во все шаблоны типа -ru-, можно добавить её в один-единственный {{-lang-}}, который вызывается из всех этих шаблонов. --Infovarius (обсуждение) 15:58, 22 декабря 2013 (UTC)
Я бы не спешил делать автоматический подсчёт для всех языков. Есть разные письменности. Вопрос что считать буквой. Иероглиф это буква или нет? В современном китайском и японском языках пробел для разделения слов не обязателен. Don Rumata 19:50, 22 декабря 2013 (UTC)
На счет разных письменностей — согласен. Однако, в таком случае надо просто решить как считать буквы для таких случаев. На данный момент всё это считается с помощью одного и того же подхода: один символ — одна буква. Т.е. каждый иероглиф идет за один символ: Категория:Слова_из_5_букв/ja. --Vitalik7 (обсуждение) 03:36, 23 декабря 2013 (UTC)
Относительно шаблона {{--lang--}} — мысль замечательная.
Правда есть трудность: в качестве параметров в него передается язык в виде слова на русском языке ("Русский", "Английский", ...), а не в виде кода ("ru", "en", ...) как нам нужно.. :( --Vitalik7 (обсуждение) 03:38, 23 декабря 2013 (UTC)
Однако, и это, в принципе, не проблема, если одобрить саму идею. Ведь можно шаблоны вида {{-ru-}} изменить таким образом, чтобы они передавали в качестве параметра шаблону {{--lang--}} еще и код языка. --Vitalik7 (обсуждение) 04:53, 23 декабря 2013 (UTC)
  • Греческие и польские статьи с subst-ами исправил - это были ошибки при использовании болванок статей. --Infovarius (обсуждение) 20:56, 20 декабря 2013 (UTC)
    Отлично! Спасибо --Vitalik7 (обсуждение) 21:19, 20 декабря 2013 (UTC)
Хочу только отметить, что длина слова - это всё-таки количество знакомест. Единственный для меня нерешённый вопрос - длина слова в сокращениях, где должна использоваться точка. Точнее, не длина слова, а необходимость включать последнюю точку сокращения в названии статьи. Например, сокращение г (грамм) точку не требует, но если сокращается слово год, то точка нужна. Или это описывать в статье? --- Vesailok 02:46, 22 декабря 2013 (UTC)
мне кажется, сокращения уже не совсем являются словами, поэтому можно у них вообще не считать длину. --Infovarius (обсуждение) 15:58, 22 декабря 2013 (UTC)
Гм.. Интересный случай. Получается, нужно еще добавить в "игнорируемые" для подсчета — слова, содержащие точку? --Vitalik7 (обсуждение) 03:42, 23 декабря 2013 (UTC)
  • Когда-то давно количество букв подсчитывал бот и подставлял в шаблон {{длина слова}}, но потом решили, что это можно делать один раз в момент создания статьи при подстановке шаблона {{длина слова}}. Это не нагружает сервер. Don Rumata 19:58, 22 декабря 2013 (UTC)
    О том, что больше нагружает сервер — можно поспорить.. Однако, хочу заметить, что, во-первых, ввиду того, что сейчас это делается людьми, а люди иногда могут ошибаться, мы имеем, например, такие случаи: "моммэ" (русское слово попало в японский индекс), во-вторых, например, случай переименования статьи не даёт изменения соответствующей категории и о ней можно просто забыть. И, наконец, в-третьих, мы имеем около 88 тысяч статей, где вообще не используется этот шаблон (из них большая часть состоит именно из кириллицы и латиницы). Добавлять в эти статьи шаблон {{длина слова}} вручную (людьми), мне кажется, совершенно нецелесообразно. Вы согласны? Есть два выхода: либо это сделает автоматизированно бот (при этом получаем некоторую дополнительную нагрузку, но эта нагрузка будет в любом случае — вне зависимости от того, сделает ее бот или человек), либо мы вообще избавимся от необходимости проставлять этот шаблон вручную (вместе с необходимостью последующей проверки правильности его подстановки) и сделаем добавление в соответствующую категорию автоматической (в заголовочных шаблонах). Второй случай может быть будет давать некоторую нагрузку при подсчете длины слова, однако не знаю, сравнится ли она когда-нибудь в итоге с нагрузкой, которая потребуется на редактирование 88 тысяч статей (точнее даже еще больше, т.к. я еще не подсчитал случаи, когда шаблон используется не полностью, без указания языка, а их исправлять тоже придется). --Vitalik7 (обсуждение) 04:05, 23 декабря 2013 (UTC)
  • Уважаемый, DonRumata, достаточно ли я обосновал необходимость принятия мер относительно использования/неиспользования шаблона {{длина слова}}? Четыре администратора Викисловаря заинтересованы в решении этой проблемы. И есть два хороших варианта ее решения.
    Вопрос к сообществу: что нужно сделать, чтобы выбрать один из этих вариантов и воплотить его в жизнь? --Vitalik7 (обсуждение) 21:22, 23 декабря 2013 (UTC)
    Все вопросы в Викисловаре решаются поиском консенсуса. Шаблон {{длина слова}} предназначен для автоматического включения слов в категорию Слова по количеству букв. Он работает правильно и отказываться от него никто не собирается. Если есть какие-то ошибки в указании количества букв, которые можно поправить ботом, то так и нужно сделать. Никаких мер относительно использования/неиспользования шаблона принимать не нужно. Don Rumata 07:54, 24 декабря 2013 (UTC)
    Попробую опять кратко:
    • я не предлагаю отказываться от шаблона {{длина слова}}
      (под "неиспользованием" я имел в виду случаи, когда шаблон не использовался, а должен был)
    • есть два варианта выхода из проблемной ситуации (массовое неправильное использование или неиспользование шаблона) и принять меры определенно нужно
      1. либо внедрить шаблон {{длина слова}} в заголовочные шаблоны (и тем самым полностью автоматизировать этот процесс)
      2. либо контролировать правильность использования шаблона {{длина слова}} c помощью бота
    • меня устраивают оба варианта, но первый кажется более логичным и правильным
    Какие у вас есть аргументы против внедрения {{длина слова}} в {{--lang--}}? --Vitalik7 (обсуждение) 14:37, 24 декабря 2013 (UTC)
    См. выше. Расчёт количества букв нужен только один раз. Совершенно незачем считать это каждый раз. Существуют письменности с фонетической формой записи, где понятие буква не применимо. Например в японской письменности Катакана, Хирагана. Don Rumata 07:18, 25 декабря 2013 (UTC)
    Экономия кажется совершенно копеечной (на превращение числа в название категории не больше ли сил уходит?) и ее перекрывают неудобства, связанные с ошибками ручной работы:
    • Статья не всегда создается из пустой заготовки: она может переделываться из другой похожей, переименовываться и т. п.
    • Множество статей не имеют {{длина слова}}, хотя по нынешней системе должны.
    Языковой шаблон в этом смысле гораздо вернее: уж он-то в статье обязательно должен быть.
    И никто не мешает для разных языков считать разное: для русского -- буквы, для китайского -- иероглифы и т. п. При желании можно и в рамках одного языка в том же духе считать несколько вещей (например, для русского несложно устроить классификацию по числу гласных, т. е. слогов; классификацию словосочетаний по числу слов и др.). Можно туда же прикрутить какие-то проверки корректности (и ловить, например, ошибки в переключении регистров, собирая подозрительные статьи в особую категорию). Для "не совсем слов" типа "10-летний" можно отключать счет (или заносить их в отдельные категории). Главное, что изменения такого рода не будут требовать правки статей.
    К тому же сейчас считается не число букв (что есть вещь осмысленная и упомянутая в названиях категорий), а число никому не нужных знакомест. Да еще и неправильно считается (врёт при создании статей для укр. слов с апострофом). -- M. G. J. (обсуждение) 09:26, 25 декабря 2013 (UTC)
    Коллега, поправить алгоритм расчёта, это пара минут. Удалить включения шаблона {{длина слова}} из тысяч статей не менее трудоёмко, чем добавить его в недостающие. Мне, честно говоря, всё равно где и когда делается расчёт длины слова. Если вы предлагаете включать расчёт в {{--lang--}}, то для начала нужно переписать сам {{--lang--}} чтобы он использовал единую таблицу трансляции кодов языков в названия, чтобы лишний раз не нагружать сервера при его изменении. Don Rumata 11:15, 25 декабря 2013 (UTC)
    Можно пока ничего не удалять, а просто заглушить. (Чтобы легко вернуть всё обратно, если вдруг какие-то проблемы вылезут или просто не понравится.) И {{--lang--}} можно пока не трогать, а сделать временный дубликат и на нем тренироваться.
    А добавление {{длина слова}} в недостающие места проблему до конца не решает: это придется повторять в будущем снова и снова.
    И заодно уж: пусть функция не число считает, а готовое название категории выдает. Вот тогда шаблонам точно меньше работы будет. -- M. G. J. (обсуждение) 11:58, 25 декабря 2013 (UTC)

Дальнейшее обсуждение тем, касающихся внесения правок ботом прошу вести публично на страницах форума. Don Rumata 22:24, 25 декабря 2013 (UTC)

Предупреждение (старое)[править]

Здесь когда-то было предупреждение, которое дааавно утратило свою актуальность. Правки оказались действительно нужными и полезными, что и доказало время. Плашку предупреждения удалил, чтобы оно не мозолило глаза. Жаль, что у нас на ВС случаются подобные недоразуменияVitalik обс 22:27, 9 июня 2015 (UTC)

Ваши массовые правки шаблонов совершены в обход процедуры поиска консенсуса. Don Rumata 21:33, 25 декабря 2013 (UTC)

Что нужно сделать, чтобы удалить это предупреждение (т.е. чтобы оно утратило актуальность)?
Я могу удалить все формы инфинитивов из шаблонов глаголов несовершенного вида, таким образом приведя их к изначальному виду. Это сделать будет легко, гораздо легче, чем было формировать их.
Этого будет достаточно? --Vitalik7 (обсуждение) 13:02, 27 декабря 2013 (UTC)
Считаю, что этого не нужно менять, пока мы не пришли общему решению. Твоё решение довольно удачное и я w ogóle не понимаю, почему Rumata упорствует. — soshial@ 13:08, 27 декабря 2013 (UTC)
Прошу прощения, что снова поднимаю этот вопрос. Причина предупреждения находится здесь. Нужно либо признать мои правки ненужными или неадекватными и откатить их. Либо признать нужными и полезными и дать добро на продолжение деятельности. В любом случае я бы хотел, чтобы это предупреждение утратило актуальность. Что для этого нужно? --Vitalik7 (обсуждение) 10:53, 5 января 2014 (UTC)
Учитывая общую напряжённость местного сообщества, советую всё-таки обождать с этим вопросом. Не поделитесь ли контактами случаем? Можно было бы обсудить некоторые вопросы из области общих интересов :) Вам удобны гугловские Hangouts? — soshial@ 23:13, 10 января 2014 (UTC)
Согласен по поводу напряженности сообщества.. И это очень печально.
Hangouts — да, удобны, хоть и редко в них доводилось общаться (2vitalik). Skype более удобен (just_vitalik). --Vitalik7 (обсуждение) 23:30, 10 января 2014 (UTC)
Понял вас. Отписался сначала на gmail. Как ответите - сразу пришлю запрос в Hangouts. — soshial@ 00:07, 11 января 2014 (UTC)

Шаблоны словоизменения[править]

Могу я попросить в свете обсуждения темы с неименованными параметрами привести количество шаблонов с нумерованными параметрами и количество без них для глаголов, существительных и прилагательных. Это моя большая просьба. Спасибо. — soshial@ 18:19, 10 января 2014 (UTC)

Я сейчас на работе, а все скрипты и база остались на домашнем компе, который сейчас, к сожалению, выключен.
Но если навскидку, то когда я парсил шаблоны словоизменения (существительные и глаголы), то заметил использование нумерованных параметров, кажется, только в одном шаблоне словоизменения глаголов (который тогда таким образом отредактировал Эл).
Когда буду дома, то специально проверю эти моменты и напишу ответ. --Vitalik7 (обсуждение) 18:34, 10 января 2014 (UTC)
Я проверил, на тот момент действительно был только один глагольный шаблон с использованием нумерованных параметров. Из существительных их было всего пять (из 460). В прилагательных не использовались нигде. --Vitalik7 (обсуждение) 21:32, 10 января 2014 (UTC)

Индекс всех слов словенского языка, составляемый вручную[править]

Виталик, можешь оформить Индекс:Словенский язык? Заранее благодарю. --- Vesailok 05:57, 22 января 2014 (UTC)

Да, с удовольствием этим займусь. Тема индексов самая первая тема, с которой я пришел в Викисловарь. Рад возможности возобновить по ней работу :) — Vitalik7 (обсуждение) 13:00, 22 января 2014 (UTC)
Это по всей видимости просто недоразумение: ඩොල්ෆින්, කළු? :) — Vitalik7 (обсуждение) 13:52, 22 января 2014 (UTC)
Поправил. — soshial@ 13:58, 22 января 2014 (UTC)
Как быстро! Спасибо :) — Vitalik7 (обсуждение) 14:03, 22 января 2014 (UTC)

Бот уже трудится над внесением словенского индекса в Викисловарь.

Несколько комментариев:

  • Я использовал "консенснусный" шаблон {{алфавит}} для стилевого оформления шапки
  • Единственное принципиальное новшество — это ссылки ↑↓ для перемещения между алфавитным указателем и конкретной секцией на странице
  • Слова для индекса брались, во-первых, из исходных страниц индекса, а, во-вторых, из самого Викисловаря (условно говоря, Категория:Словенский_язык)
  • Разбиение на страницы делал по следующему принципу
    • максимальное количество слов на странице = 1000
    • если на странице > 1000 слов, то выделяем из этой страницы подсекцию максимальной длины в отдельную страницу
    • повторяем это до тех пор, пока все страницы не будут содержать максимум 1000 слов
    • максимальный уровень вложенности сделал равным трем
  • В исходных списках словенского индекса использовались буквы вида: "đ", "ö", "ü", "ć", но они по идее не принадлежат словенскому алфавиту?

Если принципиальных замечаний не будет, может распространить этот подход и на другие индексы Викисловаря? — Vitalik7 (обсуждение) 16:28, 22 января 2014 (UTC)

В словенском, как и в хорватском, не принято менять буквы в заимствованных именах собственных из языков на основе латиницы. Поэтому и попадаются буквы других языков. --- Vesailok 22:09, 22 января 2014 (UTC)
Понял, спасибо :) Т.е. их нужно выделить в алфавит (хотя бы для второй строки)? — Vitalik7 обс 22:11, 22 января 2014 (UTC)
Не знаю как быть с "đ", "ö", "ü", "ć", но другие латинские буквы (не словенские) выделены после Ž. --- Vesailok 22:16, 22 января 2014 (UTC)
Стоп! Ссылки ↑↓ не нужны. Они нарушают заголовки разделов! В заголовках не должно быть спецсимволов! Откатывайте! Don Rumata 22:19, 22 января 2014 (UTC)
Откатить на изначальную версию без всяких заголовков и оформления? :)
И, кстати, что вы имеете против этих спецсимволов, чем они вам мешают? — Vitalik7 обс 22:22, 22 января 2014 (UTC)
Коллега, неужели вы не знаете, что заголовки разделов нужны не для красоты, а для того, чтобы на них можно было ссылаться. Don Rumata 22:27, 22 января 2014 (UTC)
Ваше «новшество» требует формирования вот такого уродства Индекс:Словенский язык/A#.E2.86.91_a.C5.BE. Это нам не нужно! Don Rumata 22:33, 22 января 2014 (UTC)
Коллега, при всём уважении, если бы во всём Викисловаре была бы хотя бы одна такая ссылка на подраздел страницы индекса, то тогда возможно это и имело бы хоть какой-то смысл. А так ваш довод весьма надуманный.
К тому же, вам ли не знать, что такое же самое "уродство" формируется абсолютно всеми подзаголовками: Индекс:Русский_язык/А#.D0.B0.D0.B7 и от стрелочек это никак не зависит. Верно также, что при желании можно и красивые вариант здесь без проблем использовать: Индекс:Словенский язык/A#↑ až, если вдруг возникнет такая необходимость. — Vitalik7 обс 22:39, 22 января 2014 (UTC)
Ничего подобного Индекс:Русский_язык/А#аз. Don Rumata 22:46, 22 января 2014 (UTC)
Вы о чем? Посмотрие на строку адреса в браузере и увидите там: https://ru.wiktionary.org/wiki/Индекс:Русский_язык/А#.D0.B0.D0.B7, разве не так?
А красивым ссылкам стрелки никак не мешают: Индекс:Словенский язык/A#↑ ažVitalik7 обс 22:49, 22 января 2014 (UTC)
Напоминаю вам, что игнорирование ВС:КОНС является нарушением, которое может повлечь блокировку учётной записи. Упрямое проталкивание неконсенсусных изменений буду расценивать как w:ВП:ДЕСТ. Don Rumata 22:53, 22 января 2014 (UTC)
Я всего лишь исполнил просьбу Vesailok.
Если считаете, что нужно вернуть индекс к изначальному варианту без оформления: [1], то я могу это сделать. Я ведь в первую очередь вас об этом и спросил! — Vitalik7 обс 22:58, 22 января 2014 (UTC)
Убирайте стрелки. Я вам подробно описал что нужно сделать перед внесением массовых изменений. См. Викисловарь:Организационные вопросы#Ботоведение. Don Rumata 23:05, 22 января 2014 (UTC)
А коллеге Vesailok должно быть стыдно за создание страниц с таким содержанием. Don Rumata 23:08, 22 января 2014 (UTC)
Такой вариант вас устроит? Индекс:Словенский_язык/BVitalik7 обс 00:04, 23 января 2014 (UTC)
Нет, только такой Индекс:Словенский_язык/A. Don Rumata 00:17, 23 января 2014 (UTC)
Аргументируйте. — Vitalik7 обс 00:19, 23 января 2014 (UTC)
Я слежу за разговором, но не врубаюсь. Поэтому молчу. --- Vesailok 00:28, 23 января 2014 (UTC)
Дело в том, что Румата сейчас сам взялся массово менять индекс, поэтому ссылки из обсуждения потеряли актуальность.
Я поясню. Изначально был предложен такой вариант: [2], но Румате не понравилось, что стрелочки попадают в ссылки. Тогда я предложил такой вариант: [3], на что у Руматы аргументов пока не нашлось. Тем не менее он продолжает вносить массовые правки. — Vitalik7 обс 00:41, 23 января 2014 (UTC)
Итак, я сам убрал стрелки, т.к. мне надоело вам объяснять очевидные вещи. Что еще вы забыли сделать:
  1. Все статьи индекса должны быть включены в категорию Викисловарь:Индекс:Словенский язык
  2. Убрать двойной отступ заголовка индекса 4 уровня. Вот так
  3. Не должно быть заголовков с дефисом на конце. Их нужно слить с таким же заголовком без дефиса. Вот так. Соответственно, их нужно убрать из заголовка индекса.
  4. Аналогично нужно поступить со словами, которые начинаются с букв не принадлежащих словенскому алфавиту. Слить их с похожими буквами.
  5. Добавить слова из Индекс:Словенский язык/P1 и Индекс:Словенский язык/P2, а сами страницы удалить.
  6. Закрыть блок <div class="index"> тегом </div>. Вот так.
  7. Удалить блок с невидимым разделом «Алфавитный указатель». Вот так.
Индексы других языков делать аналогично. Don Rumata 01:46, 23 января 2014 (UTC)
Ещё я считаю, что пустые разделы со ссылками типа Индекс:Словенский язык/A#ab тоже нужно удалить. Особого смысла в них нет. Don Rumata 02:16, 23 января 2014 (UTC)
  1. Да, хорошо добавлю в скрипт
  2. Исправлю, это мелкая огреха
  3. Тут я вас поддерживаю, это хорошая идея. В предыдущей версии скрипта именно так и делал: Участник:Vitalik7/Словари/Лопатин/О (имел в виду объединение в одну секцию)
    Однако решение пока не консенсусное: Индекс:Русский_язык/Б, Индекс:Русский_язык/В, поэтому надо сначала обсудить с другими участниками, в частности с Infovarius и Vesailok
  4. Идея частично интересная. Однако тоже пока не консенсусная.
    Буквы с диакретическими знаками слить, в принципе можно (только надо еще решить как их сортировать среди прочих), но вот как быть с буквами, совершенно не принадлежащими алфавиту?
    Например, здесь в конце страницы: Участник:Vitalik7/Словари/Ефремова/-- есть слова VIP-гость, SMS-сообщение и прочие.
  5. Да, правильно, это тоже будет не трудно
  6. Да, конечно. Возможно закрывающий тег потерялся при одном из исправлений скрипта
  7. Он нужен для функционирования стрелочек "↑", возможно имеет смысл переименовать в нечто вроде #_top или #index, чтобы адреса ссылок были красивыми
  8. Относительно использования стрелочек ваше личное мнение пока не является консенсусным. "Вреда" теперь от них нет никакого, а польза весьма большая:
    • "↑": при переходе или перелистывании страницы можно легко добраться наверх (в один клик) и перейти к другой букве
    • "↓": показывают какие ссылки будут вызывать перезагрузку страницы, а какие просто перелистнут индекс к нужной позиции
  9. Касательно удаления ссылок вида "см. ab" не согласен.
    Если мы переходим к словам из верхнего блока, то да, те ссылки "см." не нужны. Если же проходить по индексу листая его, то они становятся очень полезными и без них было бы очень неудобно.
Vitalik7 обс 10:20, 23 января 2014 (UTC)
Оставлю свои замечания.
  1. Навигацию следует оформлять в виде вызова шаблона {{Словенский индекс}}, который и должен автоматически категоризовать (я работал над {{Русский индекс}}. Можно предусмотреть автоматически настраиваемую вторую (где-то и третью?) строку.
  2. Заголовки с дефисами имхо должны быть тогда, когда следующий символ есть и он не пробел и не обычная буква алфавита. На всякий случай: Индекс:Словенский_язык/- конечно оставить.
  3. С источниками слов и принципом разбиения согласен. Хотя идеально было бы найти какой-то авторитетный словник/и и указать ссылки на него.
  4. Пустые разделы со ссылками должны быть. Как же иначе читатель будет добираться до слов из них? --Infovarius (обсуждение) 10:11, 23 января 2014 (UTC)
  1. Хорошая идея, только его и ее нужно будет сначала доработать, это да.
  2. Гм.. Согласен, тоже ведь имеет хороший смысл. Надо обсудить все "за и против" и придти к консенсусу..
  3. Это вы про буквы с диакретическими знаками?
    Только сейчас понял, что вы отвечали не Дону Румата, а мне и Vesailok. Тогда спасибо!
  4. Полностью поддерживаю
Vitalik7 обс 10:25, 23 января 2014 (UTC)
Гм.. А относительно вашего второго пункта и третьего пункта Дона Румата - получается, что у меня раньше было сделано вообще третим способом :) В общем, вариантов много, но решение надо принять одно.. Кстати, а что скажете по поводу стрелочек, облегчающих навигацию? — Vitalik7 обс 10:59, 23 января 2014 (UTC)
Виталик, да успокойтесь вы со своими стрелочками. Они никому не нужны. Для перемещения вверх используйте кнопку Home, а вниз итак ссылки из индекса ведут. Don Rumata 13:13, 23 января 2014 (UTC)
Не всегда бывает удобно лишний раз тянуться к клавиатуре — Vitalik7 обс 13:17, 23 января 2014 (UTC)
Несравнимо неудобно набирать ↑ в ссылке и объяснять новичкам зачем это нужно. Короче, никогда не использовали стрелки в названии разделов и не будем. Консенсус в оформлении индексов был достигнут авторами задолго до вашего появления. Наличие консенсуса не означает всеобщей поддержки выбранного решения. Это скорее означает, что все согласны «подчиниться» выбранному решению. См. w:ВП:КОНС. Don Rumata 14:04, 23 января 2014 (UTC)
Прошу обратить внимание на эту ссылку: [4] — и стрелочки есть, и набирать их в ссылке не нужно. Всё как вы хотите. — Vitalik7 обс 14:07, 23 января 2014 (UTC)
Коллега, смиритесь. Если лень тянутся к клавиатуре забиндите Home на кнопку мыши. Вы всё время забываете, что большинство наших редакторов не программисты. Ваши вирши со смещением блока со стрелочкой большинству непонятны, если не сказать вредны. Кроме того это лишние 2130 байтов. И вообще, чем проще, тем лучше. Don Rumata 14:55, 23 января 2014 (UTC)
Да, мне эти вирши самому не нравятся. Это была просто такая отчаянная попытка в два часа ночи найти компромиссное решение. Можно попробовать придумать что-то более адекватное, короткое и понятное. Например, сделать нечто подобное в виде css-класса. Или вообще придумать что-нибудь другое.
Против стрелочек "↓" в индексе хоть ничего не имеете против (показывают какие ссылки будут вызывать перезагрузку страницы, а какие просто перелистнут индекс к нужной позиции)? — Vitalik7 обс 15:03, 23 января 2014 (UTC)
Ну вреда в этом не вижу. Тут я готов пойти на компромисс. Don Rumata 15:08, 23 января 2014 (UTC)

┌─────────────────────────────────┘
Ура! Я действительно этому очень рад. Это для меня важно, т.к. хотел бы принимать участие в формировании индексов.
Если этот код перед заголовками:

<div style="clear: both;"></div>
<div style="position: relative; top: 27px; left: -14px; font-size: 20px;">[[#Алфавитный указатель|↑]]</div>

заменить на такой (короткий и лаконичный):

<div class="top_arrow">[[#index|↑]]</div>

сможем мы тогда достичь компромисса и в этом вопросе? — Vitalik7 обс 16:21, 23 января 2014 (UTC)

Виталик, ну право слово. Ну не нужны тут стрелочки ни в каком виде. Don Rumata 18:25, 23 января 2014 (UTC)
Я тоже считаю, что стрелочки не нужны - они делают индекс громоздче и не добавляют функциональности: ведь переходы на разделы и так уже есть. — soshial@ 08:04, 24 января 2014 (UTC)
Воздерживаюсь в вопросе о стрелочках в разделах - мне они не мешают, но и Home удобнее. В индексе же некий смысл в них есть (насчёт перезагрузки). --Infovarius (обсуждение) 12:51, 24 января 2014 (UTC)

Болгарский индекс[править]

Я снова в деле! Для пробы оформил все страницы болгарского индекса. Пожелания и претензии принимаются :) Навигация сделана в {{Болгарский индекс}}, но хочется его ещё доработать. Или стрелочки или как минимум TOC хочу. Хочется по заголовку как-то отличать (для удобной и быстрой навигации) 3 ситуации: 1) раздел находится на странице и содержит список слов; 2) раздел со списком вынесен на отдельную страницу; 3) слов с данным префиксом вообще не найдено. --Infovarius (обсуждение) 06:59, 11 февраля 2014 (UTC)

Ещё посчитаю статистику по существованию слов в Викисловаре и выложу на страницу обсуждения индекса. --Infovarius (обсуждение) 07:00, 11 февраля 2014 (UTC)
Отлично! У меня тоже были задумки по поводу шаблона навигации, например, можно алфавит брать из универсального языкового модуля language, который мы разрабатываем (просто добавить туда еще одно поле). А вторую и третью строчки генерировать на основании передаваемых параметров.. Но я сейчас в вынужденном вики-отпуске и вернуться к работе смогу только через две недели, к сожалению.. — Vitalik7 обс 11:29, 11 февраля 2014 (UTC)
  • Вот и я наконец-то вношу свою лепту в развитие индексов :)
Итак, по порядку:
  1. Разместил наработки в своём пространстве, т.к. они содержат некоторые пока еще неконсенсусные идеи:
    Участник:Vitalik/Индекс/Болгарский_язык/А
  2. Объединил текущие слова индекса с болгарскими словами в ВС (было добавлено в индекс всего 22 новых слова)
  3. Предлагаю каким-то образом выделять (например, курсивом) слова, которые в ВС есть, но в словарных статьях нужный язык еще не представлен
    Если немного переиначить, то получается, что курсивные слова — это отсутствующие слова нужного языка на момент обновления индекса
  4. Обновление можно сделать автоматическим и регулярным
  5. Важно: новый шаблон {{Алфавит}} (который использует {{алфавит}} и новый специальный модуль Модуль:Алфавит на LUA)
    Использование предельно простое и описано на странице шаблона. Тем самым легко и удобно решается задача трёх ситуаций в быстрой навигации
    Возможно что-то упустил (например, категоризацию самого шаблона)
  6. Стрелки-ссылки на блок алфавита теперь лишены абсолютно всех бывших недостатков и получили дополнительные преимущества благодаря использованию шаблона {{якорь2}}
    Адреса ссылок остаются красивыми, никакого дополнительного html/css, а переход сопровождается красивым синим выделением подраздела (как это работает для сносок)
Очень надеюсь, что моя работа будет одобрена и ее можно будет применить к индексам ВС.
Если есть какие-то замечания или предложения, то буду только рад. — Vitalik обс 16:57, 23 марта 2014 (UTC)
Оформил (куцый, но что уж было) абхазский индекс. Идея 3 правильная — попробовал в Индекс:Абхазский язык/д через новый {{i}} — его можно или в курсив превратить, или сымитировать красную ссылку (второе, правда, у меня не заработало почему-то).
Интересная идея с Алфавит'ом! Ещё не прочувствовал, попробую на чём-нибудь, скажу.
Обновления-добавления слишком частыми делать не обязательно, мне кажется. Достаточно раз в полгода или после крупных заливок по данному языку. Например, может получиться ситуация, когда случайно в индекс попадёт ссылка на мусорную статью, которая не была вовремя удалена. В этом смысле я бы предпочёл, чтобы индекс включал списки из словарей (с пометами типа {{И1}}) + существующие единицы в Викисловаре. --Infovarius (обсуждение) 09:15, 24 марта 2014 (UTC)

параметр соотв.[править]

Перенесено на страницу Обсуждение участника:VitalikBot#параметр соотв.

Обсуждение перенесено на стр. Обсуждение участника:VitalikBot Weldis (обсуждение) 09:55, 26 января 2014 (UTC).

Узурпация[править]

Коллега, ваш запрос на узурпацию учетной записи Vitalik7 → Vitalik выполнен. Пожалуйста измените подпись. Вам ещё нужны 1603 подстраниц Vitalik7/Словари? Don Rumata 11:29, 12 февраля 2014 (UTC)

Большое спасибо! :) Подпись изменил.
Те страницы — да, нужны. И, думаю, нужны сообществу, как минимум хотя бы из-за красных ссылок.. — Vitalik обс 11:35, 12 февраля 2014 (UTC)
Ну им точно не место в личном пространстве. Don Rumata 11:40, 12 февраля 2014 (UTC)
Давайте разместим их в пространстве Индекс, т.к. фактически это индексы слов из реальных словарей. Vitalik7 (обсуждение) 12:35, 12 февраля 2014 (UTC)
А зачем нам столько индексов? Достаточно одного Индекс:Русский язык. Нужно было только добавить туда недостающие слова. Тем более, что в Участник:Vitalik7/Словари/Ефремова/academic.ru/А есть странные ссылки типа «Аббатиса и Аббатисса», «Абак и Абака». Don Rumata 14:10, 12 февраля 2014 (UTC)
Вот именно из-за этих странных ссылок (о которых я, кстати, уже писал на Участник:Vitalik7/Словари) я и не торопился интегрировать их в русский индекс. Большую часть особенностей словарей я успел почистить, но не всё. Это один из таких примеров. Исправление этой особенности словаря Ефремовой на academic.ru можно автоматизировать, было бы желание. На тот момент я приостановил работу из-за проблем с консенсусом. Если идея будет поддержана сообществом, то могу интегрировать эти словари в русский индекс (после окончательного исправления словарей, конечно). — Vitalik обс 15:36, 12 февраля 2014 (UTC)
Если перенести их проблема, то пусть пока там остаются. — Vitalik обс 17:47, 12 февраля 2014 (UTC)

Вышел из вики-отпуска[править]

Всем доброго времени суток!
Я вышел из вынужденного вики-отпуска. Свободного времени будет не так уж и много, но оно по крайней мере будет.
Хотел поинтересоваться, которыми из начатых задач, по мнению сообщества или отдельных его участников, мне следовало бы заняться? :)
Индексы, языки, словоформы, шаблоны, зализняк и starling, викификация, поиск ошибок и т.п.
Идей и начинаний много. Хотелось бы приложить усилия именно там, где это необходимо и где это не вызовет ненужных противодействий. — Vitalik обс 22:13, 27 февраля 2014 (UTC)

Привет! Спасибо, что не забываете. Думаю, поиск ошибок никогда не вызовет противодействия. :)--Cinemantique (обсуждение) 23:01, 27 февраля 2014 (UTC)
Эт точно, верно подмечено) Спасибо, надо будет возобновить работу над системами автоматического их обнаружения и генерации соответствующих отчётов — Vitalik обс 23:07, 27 февраля 2014 (UTC)
Я был бы рад решённой задаче заливки словоформ. Это гигантская задача, и ваша помощь здесь неоценима (к тому же большой задел уже есть). Надеюсь, что хотя бы редиректы не вызовут возражений. Infovarius (обсуждение) 11:30, 3 марта 2014 (UTC)
Спасибо, что вспомнили об этом! Подготовил предварительную версию к обсуждению здесь: Викисловарь:Технические вопросы#СловоформыVitalik обс 20:04, 3 марта 2014 (UTC)

Замена[править]

Привет! Не могли бы вы с помощью бота заменить в статьях строку

[[Категория:]]

на шаблон {{categ||lang=}} с заполненным параметром lang?--Cinemantique (обсуждение) 16:42, 19 марта 2014 (UTC)

Привет, да, думаю. смогу. Но можно на всякий случай пример соответствующей правки? Это будет в итоге выглядеть так: {{categ|Название категории|lang=ru}}?
И еще вопрос, каким образом язык брать? Ведь в статье их может быть несколько.. Или пустым оставлять?
P.S. Можем перейти на "ты", если удобно) — Vitalik обс 17:21, 19 марта 2014 (UTC)
Да, давай. Я имел в виду именно такую строку, заполненную категорию не трогаем. В таком виде она отображается в статье, некрасиво. Да, если несколько языков, то проще оставить пустым. Но вообще, сколько языков, столько раз этот шаблон появиться должен. Но если это сложновато, то давай уберём хотя бы эту гадость.--Cinemantique (обсуждение) 18:16, 19 марта 2014 (UTC)
Перенесено на страницу Викисловарь:Организационные вопросы#Замена Категория: в статьях

Обсуждение продолжаем на форуме. Don Rumata 08:49, 20 марта 2014 (UTC)

  • Виталя, я думаю, эта работа будет продолжаться до бесконечности, ведь все новые статьи создаются с categ. Без объединения шаблонов в этой работе нет большого смысла. Может, лучше сделаешь списки с незаполненным Зализняком?--Cinemantique (обсуждение) 11:18, 29 марта 2014 (UTC)
    Относительно новых статей — достаточно лишь заменить болванки. Сейчас, наверное, этим и займусь. — Vitalik обс 14:33, 29 марта 2014 (UTC)
    Yes check.svg Готово. — Vitalik обс 14:59, 29 марта 2014 (UTC)
    Относительно Зализняка — просто только лишь списки или и возможность массово применять изменения в этих списках к словарным статьям (о чём говорили ранее)? — Vitalik обс 14:33, 29 марта 2014 (UTC)
    С применением.--Cinemantique (обсуждение) 15:00, 29 марта 2014 (UTC)
    Выделил обсуждение в отдельную тему чуть ниже: «Умные списки с незаполненным Зализняком»↓ — Vitalik обс 15:21, 29 марта 2014 (UTC)

"Умные" списки с незаполненным Зализняком[править]

Это на самом деле большая многоэтапная задача.
Однако в каком-то первом приближении можно и сейчас попробовать сделать. Вот только было бы неплохо выделить группы, на которые мы в итоге разобьём все эти слова (которые не имеют еще классификации по Зализняку).

  • Во-первых, это часть речи, род существительных, возвратность глаголов и т.п.
  • Во-вторых, по идее, это виды окончаний?
  • Возможно, если есть определённые принципы классификации и их можно довольно чётко выделить, то и реализуемо некоторое угадывание (хотя бы приближённое)?

Есть у кого-нибудь наработки по этому поводу (схемы и ключевые отличия)? — Vitalik обс 15:21, 29 марта 2014 (UTC)

  • Я подумаю чуть позже. Что касается угадывания, можешь попробовать выдирать инфу с «Вавилонской башни», но результаты, я думаю, всё равно нужно будет проверять вручную.--Cinemantique (обсуждение) 16:17, 29 марта 2014 (UTC)
    Ага, soshial тоже предлагал с нее данные снять :) — Vitalik обс 17:41, 29 марта 2014 (UTC)
  • Сначала можно начать с существительных и прилагательных. Они попроще, я заполняю индекс почти не задумываясь. Глаголы — крепкие орешки, к тому же с ними проводится сейчас работа по стандартизации.--Cinemantique (обсуждение) 16:20, 29 марта 2014 (UTC)
    Ух ты, а чем руководствуешься при выборе? — Vitalik обс 17:41, 29 марта 2014 (UTC)
    Выбираю род в скрипте, ставлю цифру, смотря какая основа, и букву, смотря на ударение. Там и выбор небольшой, чаще это 1a, 3a, 3*a, 6*a, 8a, редко _b и прочие ещё реже.--Cinemantique (обсуждение) 17:52, 29 марта 2014 (UTC) У прилагательный — 1a и 1*a; на -ский — это всегда 3aX~.--Cinemantique (обсуждение) 17:55, 29 марта 2014 (UTC)
  • Создал отчёты по шаблонам словоизменения существительных (списки слов для каждой группы шаблонов):
Уточнение: сортировка по обратному порядку
  • Постарался выделить общие черты среди этих слов (пока что вручную). Выкладываю текущие временные необобщённые результаты (на ночь глядя, поэтому пока не судите строго, завтра доработаю):
    • сущ ru f:
      1. -а -ы
      2. -я -и
      3. -га -ка -ха -ги -ки
      4. -жа -ша -ща -ча -ши -щи
      5. -ца -цы
      6. -ая -йа -ья -ея -оя -ыя -уя
      7. -ия -ии
    • сущ ru m:
      1. (заканчивается на согласную)
      2. -ь -и
      3. -к -г -х -ки
      4. -ж -ч -ш -щ -жи -щи -чи
      5. -ц -цы
      6. -й -ои
      7. -ий -ий
      8. путь (одно единственное слово)
    • сущ ru n:
      1. -о -а
      2. -ко
      3. -же -че -ще -чо
      4. -це -цо
      5. -ье -ьё -е -ё
      6. -ие -ия
  • На основании этих принципов уже нашёл в статьях массу ошибок при выборе шаблона. Завтра попробую написать скрипт, который эти ошибки будет выявлять автоматически. — Vitalik обс 23:11, 29 марта 2014 (UTC)
  • Вы тут не изобретаете велосипед? Ведь Зализняк достаточно алгоритмизирован уже. --Infovarius (обсуждение) 17:10, 30 марта 2014 (UTC)
    Если где-то уже есть довольно чёткие правила, то был бы признателен за ссылку на них.
    Возможно велосипед и изобретаю, но чтобы написать алгоритм мне необходимо разобраться в этой классификации и построить там где это возможно достаточно однозначные правила.
    К слову, некоторая часть уже готова, сейчас тестирую и проверяю (для существительных). — Vitalik обс 17:15, 30 марта 2014 (UTC)
    Что-то, наверное, отсюда можно извлечь: Викисловарь:Использование словаря Зализняка. --Infovarius (обсуждение) 18:57, 30 марта 2014 (UTC)
    Спасибо, я тоже наткнулся туда после того, как составил тот список. Однако описания там в некоторых местах либо слишком общие (без конкретики), либо слишком конкретные (без общих принципов):
    Информация полезная, но для написания алгоритма явно недостаточная.. Чуть позже попробую описать мои текущие умозаключения. — Vitalik обс 20:17, 30 марта 2014 (UTC)
  • сущ ru n на -я — это, должно быть, ошибка?--Cinemantique (обсуждение) 17:35, 30 марта 2014 (UTC)
    Если судить по данным ВС (сущ ru n ina), то вроде бы нет, не ошибка, и вот представители: знамя, пламя, рамя, племя, бремя, время, телевремя, беремя, темя, имя, полуимя, голомя, голомя, поломя, вымя, письмя, стремя, семя, льносемяVitalik обс 17:40, 30 марта 2014 (UTC)
    Да, верно. Скорее всего, список исчерпывающий на данный момент.--Cinemantique (обсуждение) 18:25, 30 марта 2014 (UTC)

Мои текущие умозаключения относительно классификации существительных (цифровые индексы):

ед. ч мн. ч Правило
Женский род (сущ ru f):
1 -а -ы последняя буква а или ы, предпоследняя: любая согласная кроме г, к, х, ж, ч, ш, щ, ц
2 -я -и (схож с №8) последняя буква я, предпоследняя: любая согласная кроме г, к, х, ж, ч, ш, щ, ц
3 -га, -ка, -ха -ги, -ки, -хи предпоследняя буква: г, к, х
4 -жа, -ча, -ша, -ща -жи, -чи, -ши, -щи предпоследняя буква: ж, ч, ш, щ
5 -ца -цы предпоследняя буква: ц
6 -йя, -ья, -ая, -ея, ... -йи, -ьи, -аи, -еи, ... последняя буква: я, и, предпоследняя: й, ь или любая гласная кроме и
7 -ия -ии оканчивается на: ия, ии
8 -ь -и (схож с №2) последняя буква: ь
Мужской род (сущ ru m):
1 -согл. -ы последняя буква: ы или любая согласная кроме г, к, х, ж, ч, ш, щ, ц
2 -ь -и последняя буква ь, и, предпоследняя: любая согласная кроме г, к, х, ж, ч, ш, щ, ц
3 -г, -к, -х -ги, -ки, -хи последняя или предпоследняя буква: г, к, х
4 -ж, -ч, -ш, -щ -жи, -чи, -ши, -щи последняя или предпоследняя буква: ж, ч, ш, щ
5 -ц -цы последняя или предпоследняя буква: ц
6 -ай, -ей, -ой, ... -аи, -еи, -ои, -ьи,... последняя буква: й, и, предпоследняя: ь или любая гласная кроме и
7 -ий -ии оканчивается на: ий, ии
8 путь пути вроде бы единственное слово в своём роде :)
Средний род (сущ ru n):
1 -о -а последняя буква о, а, предпоследняя: любая согласная кроме г, к, х, ж, ч, ш, щ, ц
2 -е -я последняя буква е, я, предпоследняя: любая буква кроме г, к, х, ж, ч, ш, щ, ц, и, ь
3 -го, -ко, -хо -га, -ки, -ка, -хи предпоследняя буква: г, к, х
4 -же, -че, -ще, -чо -жа, -ча, -ща, -чи предпоследняя буква: ж, ч, ш, щ
5 -це -цо -ца предпоследняя буква: ц
6 -ье, -ьё -ья оканчивается на: ье, ьё, ья
7 -ие -ия оканчивается на: ие, ия
8 -мя -мена оканчивается на: мя, мена

Это пока просто результат наблюдений. Надеюсь, нигде не ошибся на ночь глядя.
Также наблюдаю, что иногда встречаются некоторые единичные исключения, например, дитё, уши и пр. Возможно их можно внести в правило, а может и нельзя, надо будет исследовать отдельно.. — Vitalik обс 21:27, 30 марта 2014 (UTC)

  • На самом деле «на -ь» ни с чем не схожи: в среднем роде они оканчиваются на -мя, а в мужском — это одно-единственное слово путь (у железнодорожников оно, кстати, женского рода). А род у нас во многих статьях указан, можно начать с этих статей.--Cinemantique (обсуждение) 21:39, 30 марта 2014 (UTC)
    Спасибо! Внёс исправление в таблицу.
    И заодно уже готов отчёт "Возможные ошибки" (в выборе шаблона словоизменения).
    Руководствовался изложенными выше правилами, заодно и проверим их немного на вшивость, и доработаем в случае необходимости. — Vitalik обс 21:46, 30 марта 2014 (UTC)
    О! А Cinemantique уже оказывается два дня как всё исправил. Ура! Это получается, что бот пока ошибся только в одном случае, который является исключением? Неплохо, если так! — Vitalik обс 15:59, 2 апреля 2014 (UTC)
    Да, это был отличный и чрезвычайно полезный список, на мой взгляд.--Cinemantique (обсуждение) 16:14, 2 апреля 2014 (UTC)
  • Скопировал табличку в Викисловарь:Шаблоны словоизменений/Существительные/Цифра индекса. Дальнейшую работу над ней предлагаю делать там. — Vitalik обс 09:52, 6 апреля 2014 (UTC)
    Я так понимаю, выгруженные таблички-шаблоны нужно заполнить, после чего они будут перенесены обратно? Когда можно приступать? И желательно как-то фиксировать прогресс (сколько было всего незаполненных, сколько проработали).--Cinemantique (обсуждение) 10:57, 6 апреля 2014 (UTC)
    Нет-нет. Если вы про мои первые попытки здесь: Участник:Vitalik/Массовое_редактирование/Словоизменение/сущ/f5/, то это пока только неработоспособная заготовка.
    Ситуацию усугубляет тот факт, что данные для этой заготовки я снимал несколько дней назад и с тех пор могло что-то измениться (особенно учитывая мои массовые правки в параметре "слоги", которые еще дааалеко не закончены).
    В этой связи я постараюсь сначала заняться автоматическим обновлением этих данных, чтобы они всегда были в актуальном виде. А потом уже возможностью массового применения изменений на этой странице к реальным статьям.. — Vitalik обс 11:01, 6 апреля 2014 (UTC)

Запуск "умных" списков[править]

Cinemantique, "умные" списки для существительных вроде бы готовы: Участник:Vitalik/Массовое редактирование/Словоизменение/сущ

Сможешь попробовать позаполнять? Заодно проверим их работоспособность :)

  • Я постарался тщательно протестировать автоматическое применение на разных ситуациях здесь
  • Запуск бота для применения массовых изменений осуществляется вручную с моего компа
  • Когда бот начинает обрабатывать страницы-отчёты, то добавляет в шапку шаблон {{пишу}} и убирает его после завершения
  • Бот пока плохо обрабатывает случаи, когда для одного слова используется несколько абсолютно одинаковых вызовов шаблонов (он заменит их все)
    Так что если встретишь на страницах-отчётах повторяющееся слово с повторяющимся содержимым, то заполняй аккуратно (или не заполняй пока)

Будут какие-то замечания-предложения — пиши.

Особая просьба обращать внимание на ошибки бота в предсказании классификации по Зализняку и сообщать мне о них. Я буду улучшать алгоритм по ним.

Спасибо. — Vitalik обс 21:55, 8 апреля 2014 (UTC)

  • Отлично. А могу я что-то стереть в списке и исправить статью, например дубликаты эти?--Cinemantique (обсуждение) 02:05, 9 апреля 2014 (UTC)
    Стирать из списка лучше ничего не стоит. Бот таких действий пока не поймёт.
    А изменять оригинальные статьи — можно. Я сделал так, что при попытке использовать этот механизм над статьёй, в которой уже была изменена морфология, будет выдана ошибка о конфликте (такая), но все остальные слова будут обработаны нормально.
    Cinemantique, могу я попробовать применить твои текущие изменения к статьям? — Vitalik обс 10:48, 9 апреля 2014 (UTC)
    Cinemantique, спасибо, вроде бот неплохо справился.
    Обнаружил несколько ньюансов, которые постараюсь исправить вечером (в частности, надо будет всё-таки добавлять "{{clear}}" после отчётов, изменю порядок обхода и сообщение бота, и еще в конце было почему-то лишнее пустое срабатывание, это я тоже исправлю). — Vitalik обс 12:26, 9 апреля 2014 (UTC)
    Yes check.svg Готово. Можно снова использовать :) — Vitalik обс 18:35, 9 апреля 2014 (UTC)

Cinemantique, есть вопрос.
На сколько критично, если при полном обновления этих списков — я буду очищать старые отчёты? Имеется в виду следующее.
Например, когда я буду запускать очередную массовую задачу по исправлениям в разделах морфологии, то списки для массового редактирования придётся обновить. При этом уже исправленные варианты из них исчезнут.
Если их нужно сохранять, то я могу постараться это устроить. — Vitalik обс 22:04, 9 апреля 2014 (UTC)

Да убирай, конечно. Они теперь только мешаются.--Cinemantique (обсуждение) 01:01, 10 апреля 2014 (UTC)
Хорошо, спасибо. Я буду предупреждать, когда буду заниматься массовыми правками (с последующей перегенерацией отчётов).
Пока что вопрос со слогами повис в воздухе, так что продолжать с ними до принятия решения смысла нет. — Vitalik обс 11:27, 10 апреля 2014 (UTC)

Пометы[править]

Привет! Вот какая задумка появилась. Когда будет время и желание, попробуй осуществить. В древних статьях встречается помета, оформленная без шаблона, как истор. здесь. Их бы найти все для начала и попробовать часть обработать ботом.--Cinemantique (обсуждение) 04:22, 25 марта 2014 (UTC)

Два вопроса: 1). искать их нужно только в разделе "Значение" или во всей словарной статье? 2). почему обработать ботом только часть из них? — Vitalik обс 10:19, 26 марта 2014 (UTC)
Да, надо просто искать необычный текст в тегах курсива, что-то типа такого: # ''xxx.''. А почему часть: если на месте xxx стоит известная помета для которой есть шаблон, то меняем ботом # ''xxx''# {{xxx.|язык}} (+ проверить, что дальше 1 пробел). Но там могут быть необычные пометы, сдвоенные пометы и вообще всё что угодно.--Cinemantique (обсуждение) 10:26, 26 марта 2014 (UTC)
1). "Да" — значит везде искать или только в разделе "Значение"? 2). Известными считать все пометы в категории «Шаблоны помет» и ее подкатегориях, верно? — Vitalik обс 21:04, 26 марта 2014 (UTC)
Только «Значения». Лучше взять из Стилистические пометы и Пометы областей знаний. Остальное выгрузить куда-нибудь, чтобы посмотреть.--Cinemantique (обсуждение) 21:23, 26 марта 2014 (UTC)
Т.е. остальные пометы считать неизвестными? "Остальные выгрузить" — это имелось в виду сделать аналогичное тому, что я сделал ниже, но при этом расширить список известными пометами из других категорий? Хм.. А зачем, если содержимое тех категорий и так известно?.. Или нужно просто проверить, используются ли они там? — Vitalik обс 21:33, 26 марта 2014 (UTC)

Промежуточные результаты[править]

Список помет, найденных по шаблону "# ''xxx.''" (без пробелов) и отсутствующих среди известных помет:

  • ав.
  • авт.
  • ам.
  • араб.
  • арх.
  • астр.
  • аттич.
  • библ.
  • богословск.
  • бот.
  • воен.
  • возвр.
  • ген.
  • геом.
  • гл.
  • грамм.
  • греч.
  • дипломат.
  • дор.
  • досл.
  • евр.
  • изд.
  • издевательск.
  • инд.
  • иноск.
  • искусствовед.
  • испанск.
  • ист.
  • ит.
  • канад.
  • книж.
  • коллект.
  • комерч.
  • коммерч.
  • компьют.
  • косв.
  • кул.
  • кулинар.
  • ласкат.
  • линг.
  • лит.
  • литер.
  • лог.
  • марк.
  • масд.
  • межд.
  • междом.
  • мест.
  • местн.
  • мин.
  • миф.
  • мор.
  • нар.
  • нареч.
  • непереходн.
  • обобщ.
  • образн.
  • общелог.
  • определит.
  • оптич.
  • орн.
  • отглагольн.
  • относит.
  • перен.
  • повелит.
  • подр.
  • позднелат.
  • политех.
  • польск.
  • послелог.
  • преимущ.
  • прил.
  • простореч.
  • разг.-регион.
  • разн.
  • региональн.
  • рел.
  • рит.
  • романтич.
  • с.-х.
  • самост.
  • сель.-хоз.
  • сказ.
  • сл.
  • сленг.
  • см.
  • субст.
  • суеверн.
  • сущ.
  • танц.
  • тех.
  • тоск.
  • трад-нар.
  • уменьш.-ласкат.
  • уст.
  • фраз.
  • фразеол.
  • част.
  • частич.
  • частичн.
  • числ.
  • шашечн.
  • эк.
  • эл.
  • электрон.
  • энт.
  • юрид.

P.S. Это пока среди всего текста статьи, и фильтрация по всем известным пометам. — Vitalik обс 21:29, 26 марта 2014 (UTC)

  • У некоторых помет есть синонимы-перенаправления и эквиваленты без перенаправлений. В общем, я могу написать, на что заменять. Но я не все пометы смогу распознать. Сделай такой список только для «Значения», чтобы мы на синонимы-антонимы не наткнулись (там пока не меняем).--Cinemantique (обсуждение) 21:42, 26 марта 2014 (UTC) ... Да и только по тем двух категориям.--Cinemantique (обсуждение) 21:44, 26 марта 2014 (UTC)
    Это уже немного сложнее, но завтра постараюсь заняться. — Vitalik обс 22:36, 26 марта 2014 (UTC)

А пока что еще такой вот отчётец (просто добавил частоту встречания этих курсивных текстов и упорядочил по ней):

  • прил. (1427)
  • нар. (613)
  • мест. (122)
  • част. (68)
  • перен. (67)
  • частичн. (60)
  • числ. (37)
  • нареч. (30)
  • сущ. (29)
  • грамм. (28)
  • бот. (20)
  • уст. (11)
  • коммерч. (9)
  • мор. (7)
  • межд. (7)
  • воен. (7)
  • тех. (7)
  • библ. (5)
  • ам. (5)
  • ист. (5)
  • фраз. (4)
  • субст. (4)
  • частич. (4)
  • сл. (4)
  • лит. (4)
  • марк. (4)
  • арх. (3)
  • комерч. (3)
  • гл. (3)
  • разн. (3)
  • инд. (3)
  • местн. (3)
  • обобщ. (2)
  • рел. (2)
  • эк. (2)
  • орн. (2)
  • см. (2)
  • с.-х. (2)
  • астр. (2)
  • ит. (2)
  • масд. (2)
  • сленг. (2)
  • ген. (2)
  • лог. (1)
  • иноск. (1)
  • послелог. (1)
  • итал. (1)
  • богословск. (1)
  • относит. (1)
  • трад-нар. (1)
  • определит. (1)
  • шашечн. (1)
  • разг.-регион. (1)
  • позднелат. (1)
  • миф. (1)
  • преимущ. (1)
  • ласкат. (1)
  • простореч. (1)
  • книж. (1)
  • оптич. (1)
  • уменьш.-ласкат. (1)
  • геом. (1)
  • сель.-хоз. (1)
  • авт. (1)
  • общелог. (1)
  • танц. (1)
  • араб. (1)
  • романтич. (1)
  • мин. (1)
  • региональн. (1)
  • суеверн. (1)
  • повелит. (1)
  • изд. (1)
  • энт. (1)
  • косв. (1)
  • литер. (1)
  • возвр. (1)
  • эл. (1)
  • электрон. (1)
  • тоск. (1)
  • дор. (1)
  • подр. (1)
  • компьют. (1)
  • кул. (1)
  • искусствовед. (1)
  • греч. (1)
  • юрид. (1)
  • дипломат. (1)
  • досл. (1)
  • аттич. (1)
  • кулинар. (1)
  • издевательск. (1)
  • образн. (1)
  • междом. (1)
  • политех. (1)
  • канад. (1)
  • рит. (1)
  • коллект. (1)
  • ав. (1)
  • непереходн. (1)
  • евр. (1)
  • испанск. (1)
  • отглагольн. (1)
  • польск. (1)
  • линг. (1)
  • сказ. (1)
  • самост. (1)
  • фразеол. (1)

P.S. Обнаружил в ВС такие шаблоны (из тех, что перечислены выше):

  • арх.
  • бот.
  • воен.
  • геом.
  • ист.
  • канад.
  • лит.
  • литер.
  • местн.
  • мор.
  • нареч.
  • перен.
  • простореч.
  • рел.
  • с.-х.
  • субст.
  • тех.
  • уст.

Это всё редиректы, кроме "нареч." — Vitalik обс 22:36, 26 марта 2014 (UTC)

С редиректными можно заменять так же или исправлять на основное название шаблона, не принципиально.--Cinemantique (обсуждение) 22:50, 26 марта 2014 (UTC)

Пустая строка[править]

Привет! Нашёл ещё работку. :) Надо убрать пустую строку из шаблона «перевод-блок» (1). Или, может, это можно исправить правкой шаблона? Чтобы таблица не разбухала от этой строки.--Cinemantique (обсуждение) 10:11, 26 марта 2014 (UTC)

Да, действительно исходный вариант жутковато смотрится :) Вечером постараюсь запустить бота — Vitalik обс 10:18, 26 марта 2014 (UTC)
Бота запустил — Vitalik обс 20:53, 26 марта 2014 (UTC)
Yes check.svg Итого: 461 исправление (9 ошибочных, отменил) — Vitalik обс 22:26, 26 марта 2014 (UTC)
Отлично, спасибо!--Cinemantique (обсуждение) 22:47, 26 марта 2014 (UTC)

Список красных[править]

Всё-таки интересно было бы суммировать всё это и выдернуть красное.--Cinemantique (обсуждение) 21:25, 30 марта 2014 (UTC)

Спасибо, что вспомнил об этом, теперь есть повод заняться :)
Думаю, это можно будет сделать, правда надо сначала сильно заморочиться над автоматическим умным исправлением ошибок в Ефремовой из academic.ru (писал об этом здесь), а именно: идентификация и разделение случаев вида "Аббатиса и Аббатисса", а также исправление редкой неправильной заглавной буквы.. — Vitalik обс 21:34, 30 марта 2014 (UTC)
Первое - да, желательно исправить. Насчёт второго не уверен. Дело в том, что Апостол - это богослужебная книга (а не человек), а аполлон - это бабочка. Возможно, по этой части ошибок и нет вовсе.--Cinemantique (обсуждение) 21:43, 30 марта 2014 (UTC)

Переименование категорий к единому стилю[править]

Удалил плашку предупреждения, чтобы она не мозолила глаза. Текст частично сохранил "для истории", чуть ниже.Vitalik обс 22:35, 9 июня 2015 (UTC)

Ваши действия по переименованию категорий и правки соответствующих шаблонов словоизменения произведены без публичного обсуждения в обход правила поиска консенсуса. Don Rumata 14:27, 4 апреля 2014 (UTC)

Уважаемый, коллега,
Вы сами лично мне в скайпе написали: "По-любому нужен шаблон формирующий название категории по имени языка, сейчас сильный в этом разнобой. Мы могли бы сделать правило, как в аглийском разделе об использовании модуля."
Мой отчёт по категориям шаблонов словоизменения был размещён на странице "Викисловарь:Технические_вопросы#Название категории" с 17 марта 2014 года и никаких возражений с тех пор не последовало.
Мою деятельность по созданию языкового модуля поддержали очень многие в ВС (да и Вы, если я правильно помню, тоже).
Если Вы считаете, что эту деятельность нужно свернуть, то напишите об этом прямо. Причина, цель и смысл предупреждения от меня ускользают. — Vitalik обс 14:52, 4 апреля 2014 (UTC)
Виталик, никакого консенсуса в обсуждении я не вижу. Вы ложно трактуете отсутствие возражений в обсуждении как знак согласия с вашими предложениями. Тут добровольный проект. Каждый берется за то, в чём разбирается, и уделяет этому большую часть времени. Вы всё время педалируете принятие вашего решения. Это неприемлемо. С самого начала я старался вам объяснить, что в проекте есть более приоритетные задачи. Теперь о сути моих возражений. Названия языков бывают двух видов: существительные (пушту, токипона, билин) и субстантивированные прилагательные (русский, английский, немецкий). В русском языке существует две схемы подчинительных словосочетаний, выражающих атрибутивные (определительные) отношения. В первой схеме используется согласование. Например, русские числительные (прилагательное пред главным словом); во второй — управление: числительные пушту, существительные токипоны (дополнение в род. п.). Это элементарные правила семантики словосочетаний. Don Rumata 17:52, 4 апреля 2014 (UTC)
Если вы соизволите повнимательнее посмотреть на мои правки, то убедитесь в том, что именно к этим двум схемам я и приводил все ошибочные именования.
Было так: Токипона наречия, Токипона глаголы, Токипона прилагательные, стало так: Наречия токипона, Глаголы токипона, Прилагательные токипона, руководствовался существующим Существительные токипона.
По поводу Числительные пушту я руководствовался тем, что остальные категории именовались по первой схеме: Пуштунские наречия, Пуштунские местоимения, Пуштунские существительные, Пуштунские прилагательные. Соответственно я просто привёл единичный исключительный случай к общему виду: Пуштунские числительные.
И в чём, позвольте поинтересоваться, я педалирую принятие какого-то моего "мифического" решения?? В чём оно хоть заключается, не просветите?
Не лучше ли сначала поговорить/обсудить, а потом уже принимать такие скоропостижные и вредные решения, как угроза полной блокировки? — Vitalik обс 19:02, 4 апреля 2014 (UTC)

Исправить бы шаблоны для болванок статей[править]

Создаю новые статьи автоматически, но там не исправлена фраза {{categ||lang=}} на {{Категория||язык=}}. --- Vesailok 17:51, 4 апреля 2014 (UTC)

Хм.. А как именно создаёте?.. — Vitalik обс 20:44, 4 апреля 2014 (UTC)
А, да, понял свою ошибку. Я раньше только {{categ|||lang=}} заменял, а надо было еще {{categ||lang=}} :) Спасибо! — Vitalik обс 20:55, 4 апреля 2014 (UTC)

Подстановка шаблонов[править]

Перенесено со страницы Обсуждение шаблона:Категория#Разрешить использование в других шаблонах

Для использования в шаблонах есть шаблоны {{main other}}, {{template other}}, {{talk other}}, {{user other}} {{module other}}. Don Rumata 20:15, 6 апреля 2014 (UTC)

Не очень понял, к чему это вы? — Vitalik обс 20:16, 6 апреля 2014 (UTC)
К тому, что в шаблоны это не статьи и они помещаются в категорию Шаблоны словоизменений по языкам. Там трансляция кода в текст не нужна. Don Rumata 20:21, 6 апреля 2014 (UTC)
Она там нужна. Но не для Шаблоны словоизменений по языкам, а для категорий вида Русские наречия. — Vitalik обс 20:25, 6 апреля 2014 (UTC)
Господи, Виталий, я же вам написал, что в статьях шаблон {{Категория}} будет нормально работать даже если он вызывается из другого шаблона, т.к. пространство проверяется в момент включения шаблона на странице. Don Rumata 20:31, 6 апреля 2014 (UTC)
Ох, Румата. Да здесь же два разных вопроса оказались затронуты. Сейчас речь не о пространстве имён, а об использовании шаблона не только для семантических категорий. — Vitalik обс 20:35, 6 апреля 2014 (UTC)
Коллега, вы не понимаете принципа включения шаблонов. Шаблоны разворачиваются при включении. И на важно на каком уровне делается включение. Например шаблон {{сущ ru m ina 1a}} использует шаблон {{inflection сущ ru}}, который использует {{inflection сущ ru/cat}}, в котором подставляется категория после проверки #ifeq:{{NAMESPACE}}|{{ns:0}}. Так вот, эта проверка происходит, только в статьях. Don Rumata 20:43, 6 апреля 2014 (UTC)
Очень неприятно, коллега, что вы считаете остальных участников глупее себя. Я не раз уже замечал, как вы "кидаетесь" прописными истинами унижая собеседника. Зачем третий раз повторять одно и тоже? Или мне нужно каждую вашу фразу повторять, чтобы было ясно, что я ее понимаю?
Включение шаблонов вещь очевидная, и вы могли бы догадаться о том, что мне она известна хотя бы по этому комментарию:
Это поможет для категории, указанной внутри <includeonly></includeonly>, а если ее надо использовать в <noinclude></noinclude>, то ничего не получится.
А теперь по существу.
Вам — я тогда написал, что включение не будет работать в секции <noinclude></noinclude>, и поэтому там шаблон {{Категория}} использовать сейчас невозможно.
Далее Infovarius предложил использовать шаблон {{Категория}} только для семантических целей. Я в ответ выразил сомнение в целесообразности такого подхода, т.к. использовать этот шаблон было бы удобно и для случая "Русские наречия" и для случая "Шаблоны словоизменения по языкам/ru".
Сразу после этого между нами началась неадекватная беседа слепого с глухим (в том смысле, что говорили на самом деле о разных вещах). — Vitalik обс 21:51, 6 апреля 2014 (UTC)

┌───────────────────┘
w:ВП:ЭП, коллега. Считайте это тоже предупреждением. Don Rumata 06:57, 7 апреля 2014 (UTC)

Недопустимость оскорблений[править]

А это обвинение в клевете является нарушением w:ВП:НО. Коллега, я боюсь, что продолжение такого агрессивного стиля общения неминуемо приведёт к блокировке вашей учетной записи. Don Rumata 07:36, 7 апреля 2014 (UTC)

Жаль, что вы к себе правило w:ВП:ЭП не применяете, это избавило бы от не совсем порой адекватной реакции с моей стороны. — Vitalik обс 08:53, 7 апреля 2014 (UTC)
Коллега, тут много администраторов. Если у вас есть претензии к соблюдению мной правил, вы можете попросить любого другого администратора рассмотреть ваши жалобы. Я абсолютно уверен в непредвзятости их мнения. Только, пожалуйста, при подаче жалобы приводите ссылки на правки в обсуждении, в которых, по вашему мнению, я нарушил w:ВП:ЭП. Don Rumata 10:03, 7 апреля 2014 (UTC)
Я пока предпочту не усугублять наш конфликт и выражу большую надежду, что подобное повторяться не будет. Попробуем начать с чистого листа. — Vitalik обс 10:07, 7 апреля 2014 (UTC)

Skype[править]

"Запрос ожидает ответа" :) --Infovarius (обсуждение) 07:45, 10 апреля 2014 (UTC)

Ура, есть контакт! :)
Все скайповоды присоединяйтесь к нашему чату:
skype:?chat&blob=89zmSLAtJPZL9F-xDzv12thQuffDeWDfNqBo1Ny9q7FalFq53fSCJWcsKoTzZ-uYfeXUQsZ5SADTjyFbfzLb44zNqd7Zj6bn6UAh36hVlMg — Vitalik обс 11:24, 10 апреля 2014 (UTC)

Флаг администратора[править]

Поздравляю! По результатам голосования вам присвоен флаг Администратора. Ещё раз тщательным образом изучите правила и руководства Викисловаря, а также памятку администратору Википедии.

Полезные ссылки:

Не забывайте, что флаг администратора наделяет участника не только правами, но обязанностями. Желаю плодотворной работы Don Rumata 09:13, 24 июня 2014 (UTC)

Загрузка файлов, Мастер загрузки?[править]

Wikimedia Commons logo

Hello! Sorry for writing in English. As you're an administrator here, please check the message I left on MediaWiki talk:Licenses and the village pump. Thanks, Nemo 19:22, 18 сентября 2014 (UTC)

Категория Месацы/sah[править]

Пожалуйта отмените 'Категорию:месацы/sah'. Cпасибо. Saterus (обсуждение) 16:47, 17 октября 2014 (UTC)

Yes check.svg Сделано --- Валентин 16:56, 17 октября 2014 (UTC)

Bots[править]

I apologize for sending this message in English.

You are receiving this message because a technical change may affect a bot, gadget, or user script you have been using. The breaking change involves API calls. This change has been planned for two years. The WMF will start making this change on 30 June 2015. A partial list of affected bots can be seen here: https://lists.wikimedia.org/pipermail/wikitech-l/2015-June/081931.html This includes all bots that are using pywikibot compat. Some of these bots have already been fixed. However, if you write user scripts or operate a bot that uses the API, then you should check your code, to make sure that it will not break.

What, exactly, is breaking? The "default continuation mode" for action=query requests to api.php will be changing to be easier for new coders to use correctly. To find out whether your script or bot may be affected, then search the source code (including any frameworks or libraries) for the string "query-continue". If that is not present, then the script or bot is not affected. In a few cases, the code will be present but not used. In that case, the script or bot will continue working.

This change will be part of 1.26wmf12. It will be deployed to test wikis (including mediawiki.org) on 30 June, to non-Wikipedias (such as Wiktionary) on 1 July, and to all Wikipedias on 2 July 2015.

If your bot or script is receiving the warning about this upcoming change (as seen at https://www.mediawiki.org/w/api.php?action=query&list=allpages ), it's time to fix your code!

Either of the above solutions may be tested immediately, you'll know it works because you stop seeing the warning.

Do you need help with your own bot or script? Ask questions in e-mail on the mediawiki-api or wikitech-l mailing lists. Volunteers at m:Tech or w:en:WP:Village pump (technical) or w:en:Wikipedia:Bot owners' noticeboard may also be able to help you.

Are you using someone else's gadgets or user scripts? Most scripts are not affected. To find out if a script you use needs to be updated, then post a note at the discussion page for the gadget or the talk page of the user who originally made the script. Whatamidoing (WMF) (talk) 19:03, 17 июня 2015 (UTC)

Предупреждение[править]

Использование модулей с ошибками скриптов, как и нарушением ВС:МНОГОЕ недопустимо! Повторный откат буду расценивать как намеренный вандализм. Don Rumata 20:56, 11 августа 2015 (UTC)

Где именно вы обнаружили ошибку? — Vitalik обс 21:01, 11 августа 2015 (UTC)
Дальнейшее обсуждение здесь: Обсуждение участника:DonRumata#Предупреждение. По всей видимости это была "ложная тревога". — Vitalik обс 21:16, 11 августа 2015 (UTC)

Голосование об организации проекта "Иноязычное слово дня"[править]

Добрый день! Просим Вас принять участие в голосовании по поводу организации проекта "Иноязычное слово дня". --MediaWiki message delivery (обсуждение) 17:34, 27 сентября 2015 (UTC).

Викисловарь:Организационные_вопросы#Синяя ссылка на дополнительную инф. в шаблоне {{adv ru}}[править]

Здравствуйте, коллега! Возможно Вас заинтересует обсуждение Викисловарь:Организационные_вопросы#Синяя ссылка на дополнительную инф. в шаблоне {{adv ru}}, а также в {{prep ru}}, {{conj ru}}, {{interj ru}}, {{predic ru}} и т. п. MediaWiki message delivery (обсуждение) 13:08, 17 октября 2015 (UTC)

Редактирование статьи "вредина".[править]

Прошу вас помочь! Статья защищена, каким образом можно внести необходимые изменения? Арктик (обсуждение) 20:07, 29 октября 2015 (UTC)

Арктик, защита снята.--Cinemantique (обсуждение) 19:59, 29 октября 2015 (UTC)
Благодарю, в том числе и за напоминание о подписи. Арктик (обсуждение) 20:07, 29 октября 2015 (UTC)
Редактирование закончено. При необходимости- можно возвращать защиту. Арктик (обсуждение) 20:30, 29 октября 2015 (UTC)
Если не затруднит- проверьте, пожалуйста рискователь. Арктик (обсуждение) 01:41, 30 октября 2015 (UTC)

Иконка в избранной статье[править]

Приглашаем на голосование, по поводу смены смены значка, которым помечаются избранные статьи. С уважением, --MediaWiki message delivery (обсуждение) 15:59, 7 ноября 2015 (UTC)

Судьба проекта Иноязычное слово дня[править]

Здравствуйте! Приглашаем Вас поучаствовать в голосовании по поводу дальнейшей судьбы проекта "Иноязычное слово дня". С уважением, --MediaWiki message delivery (обсуждение) 16:30, 30 ноября 2015 (UTC)

Судьба проекта Иноязычное слово дня[править]

Здравствуйте! Приглашаем Вас поучаствовать в голосовании по поводу дальнейшей судьбы проекта "Иноязычное слово дня". С уважением, --MediaWiki message delivery (обсуждение) 16:30, 30 ноября 2015 (UTC)

Удаление страниц[править]

Приглашаем Вас к:

Надеемся на Ваш отклик. С уважением,

Смесь кириллицы и латиницы[править]

Your bot's reports on the mix of Cyrillic and Latin letters are very useful. Here are some more suggestions:

  • The namespace Шаблон: should also be covered, both for article titles and for contents. --LA2 (обсуждение) 20:10, 9 апреля 2016 (UTC)
    I've covered "Шаблон:" for titles as for now: templates and templates-redirectsVitalik обс 09:16, 21 апреля 2016 (UTC)
  • Mixes between a one-letter word and the next word should be reported, e.g. "говорит o музыке". Possibly with an exception for Roman numerals, e.g. "в X веке", where a Latin "X" is not wrong. --LA2 (обсуждение) 20:10, 9 апреля 2016 (UTC)
    New content reports for some of such cases are hereVitalik обс 09:16, 21 апреля 2016 (UTC)
    Хорошо, спасибо! --LA2 (обсуждение) 02:17, 22 апреля 2016 (UTC)

It would be nice if the summary (here) was updated too. --LA2 (обсуждение) 18:53, 24 апреля 2016 (UTC)

Works fine now. Thanks! --LA2 (обсуждение) 22:48, 25 апреля 2016 (UTC)
There was a problem in one of the other reports, so whole process had been stopped at some point. — Vitalik обс 07:29, 26 апреля 2016 (UTC)

Обсуждение Викисловарь:Организационные_вопросы#О параметре |фамилии= и др. в шаблонах {{родств-блок1}} и |полн=[править]

Здравствуйте! Просим Вас принять участие в обсуждении «О параметре |фамилии= и др. в шаблонах {{родств-блок1}} и |полн=» на стр. [[Викисловарь:Организационные_вопросы#О параметре |фамилии= и др. в шаблонах {{родств-блок1}} и |полн=]]. --MediaWiki message delivery (обсуждение) 01:18, 11 августа 2016 (UTC)

Судьба анонимного редактирования в ряде пространств Викисловаря[править]

Как замечено, большинство анонимных правок мешают нормальной работе участников проекта и наносят вред словарю: содержат разного рода вандализм, грубо нарушают структуру статей. Поэтому запущено голосование, которое должно определить, смогут ли анонимные участники править некоторые пространства имён (основное, Шаблон, Модуль, Категория, Справка). Приглашаем Вас к участию в решении вышеозначенной проблемы. С уважением, MediaWiki message delivery (обсуждение) 18:01, 30 сентября 2016 (UTC)

Расчистка ВС:КУ[править]

Приглашаем Вас к обсуждению статей, предлагавшихся к удалению, но обсуждение которых не завершено. Убедительно просим Вас обратить внимание на давние незавершённые обсуждения. С уважением, MediaWiki message delivery (обсуждение) 15:24, 22 декабря 2016 (UTC)

Share your experience and feedback as a Wikimedian in this global survey[править]

Война в су-[править]

Прошу обратить внимание на войну устроенную участником здесь и разобраться. --Mahairod (обсуждение) 15:56, 9 марта 2017 (UTC)

На сколько я понял, обсуждение этого вопроса находится здесь: Обсуждение участника:Cinemantique#су-Vitalik обс 20:50, 9 марта 2017 (UTC)