Викисловарь:Технические вопросы/2013

Материал из Викисловаря

Это архив форума за 2013 г. Текущая страница обсуждения технических вопросов - здесь. Архивы обсуждений: 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 | текущее

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.


Расширение Extension:Variables[править]

Описание тут: Extension:Variables

Предлагается подключить его к здешнему движку.

И тогда можно будет заменить приписывание всяких "/ru" и "lang=ru" скрытой автоматизацией: в шаблоны типа Шаблон:-ru- добавить функциональность "текущий язык — такой-то", а потом где надо можно будет извлекать значение этого текущего языка; кроме того, параллельно можно будет считать, сколько всего языков было (чтобы в самом низу статьи не заботиться о параметре шаблона Шаблон:multilang). И вообще переменные вещь полезная. -- M. G. J. (обсуждение) 09:06, 21 декабря 2013 (UTC)[ответить]

Не хватает прав, чтобы сделать из страницы редирект[править]

Страница переливатьcя является клоном страницы переливаться.
Разница в заголовках: первый из них содержит английскую букву "c", второй же (правильный) состоит только из русских букв.
Что касается содержимого, то во второй странице оно более полное, а в первой нет никакой уникальной информации.
Вердикт: первую страницу либо необходимо удалить, либо сделать из нее редирект на вторую страницу. --Vitalik7 (обсуждение) 20:26, 10 декабря 2013 (UTC)[ответить]

Вот еще клоны: улепетывать / улепётывать (е/ё). Правда, ситуация несколько сложнее (содержимое немного отличается, в частности семантика). --Vitalik7 (обсуждение) 21:05, 10 декабря 2013 (UTC)[ответить]
В качестве доказательства ошибочности существования статьи улепетывать (через "е") можно привести тот аргумент, что внутри статьи: и заголовок, и содержимое оперирует именно со словом через букву "ё", а не "е". --Vitalik7 (обсуждение) 10:31, 11 декабря 2013 (UTC)[ответить]
Последние два случая уже "исправлены" редиректом, но мне кажется, что ошибочные варианты лучше вообще удалить (также как поступили с ­пристальность немного выше). --Vitalik7 (обсуждение) 18:11, 14 января 2014 (UTC)[ответить]
 Сделано --- Vesailok 18:42, 14 января 2014 (UTC)[ответить]
Спасибо за оперативность! :) --Vitalik7 (обсуждение) 18:44, 14 января 2014 (UTC)[ответить]
  • В прошлый раз я запускал скрипт поиска мешанины латиницы и кириллицы в заголовках словарных статей только для тех, что содержали в себе {{-ru-}}. Сейчас попробовал это сделать вообще для всех статей (и для редиректов в том числе).
    Результаты получились довольно неожиданные: смотреть здесь.
    Я выделял латиницу красным и если статья является редиректом, то указывал это в скобках.
    Условно все случаи можно разделить на такие группы:
    • слова, являющиеся в общем-то правильными (например, SIM-карта, POS-терминал и др.)
      некоторые из них можно отфильтровать по принципу: дефис разделяет латинскую и кириллическую части, некоторые можно добавить в исключения (например, ВИD)
    • ошибочное использование латинского символа вместо кириллического: cоучастие, пiсня, центрoфуга, пиjаца и т.д.
      прошу обратить внимание, что символы "i"/"і", "j"/"ј" являются разными символами, также как и "c"/"с", "o"/"о" и прочие, не смотря на то, что выглядят абсолютно одинаково
    • ошибочное использование кириллического символа вместо латинского: konstruktorе, tibbiеt, аbrasion и т.д.
      собственно, все аналогично прошлому пункту
    • возможно старые редиректы, которые может стоит просто удалить? Корень:wegh, Спряжение глагола abaisser, Index ц, Суффикс:ar и т.д.
      не очень красиво, что они попадают в основное пространство, к тому же корни и суффиксы у нас вроде принято называть так: wegh-, -ar-, спряжения находятся в пространстве "Приложения:", индексы в "Индекс:" и т.п.?
Скрипт поиска работает всего полминуты, поэтому если нужно будет запустить его заново — это не проблема. --Vitalik7 (обсуждение) 23:17, 15 января 2014 (UTC)[ответить]
Работы невпроворот. :) Предлагаю взяться за это всем миром. А здесь можно решить, что делать с ошибочными редиректами. Кто-то, может быть, хочет их оставить?--Cinemantique (обсуждение) 02:06, 16 января 2014 (UTC)[ответить]
С последними редиректами надо ещё подумать/обсудить. Может быть, удобнее иметь аффиксы в своих пространствах имён? Где держать полные спряжения (а в некоторых языках это могут быть огромные таблицы)? В англ.Викисловаре, кажется, держат в основной статье в свёрнутом виде, во франц. выносят на отдельную страницу (или наоборот). Но "Index ц", конечно, не нужны. --Infovarius (обсуждение) 09:39, 17 января 2014 (UTC)[ответить]
Может быть, удобнее иметь аффиксы в своих пространствах имён? — нет, аффиксы это словарные статьи. Где держать полные спряжения? — согласно ВС:ПОС — только в разделе «Морфологические и синтаксические свойства». Don Rumata 13:10, 17 января 2014 (UTC)[ответить]
Какое в итоге примем решение относительно именования морфем (аффиксов, корней и пр.)? Суффикс:ar или -ar-? Или остаются (и внедряются) оба эти варианта с редиректами от одной схемы к другой? Какая схема в таком случае будет считаться основной, а какая дублирующей? --Vitalik7 (обсуждение) 13:44, 17 января 2014 (UTC)[ответить]
Всё будет как и раньше. Никаких префиксов Суффикс: не нужно. Суффиксы начинаются с дефиса -ar, префиксы заканчиваются им. Зачем описывать корни я вообще не понимаю. Для этого есть раздел «Родственные слова» и Шаблоны родственных слов/ru. Don Rumata 14:01, 17 января 2014 (UTC)[ответить]
Отлично, тогда почти все найденные ошибки могут быть со временем исправлены.
Касательно корней и родственных слов, у первого способа (выделение корня в отдельную статью) есть несомненное преимущество: не нужно дублировать информацию и следить за тем, чтобы она была одинаковой (за исключением одного слова, текущего) для всех родственных слов. --Vitalik7 (обсуждение) 14:10, 17 января 2014 (UTC)[ответить]
Некоторый итог: общими усилиями участников пока были удалены 63 ошибочных элемента, осталось еще 350.
Я начал работу по написанию системы автоматизированного поиска ошибок в Викисловаре. Пробую изначально сделать ее удобно расширяемой. Ошибки ищутся либо по мере добавления/удаления новых записей в БД ("инкрементная проверка"), либо с помощью обхода всей локальной БД ("полная проверка"). Локальная БД (которая потом скорее всего будет перемещена на внешний хостинг), как я писал ранее, автоматически обновляется за счет информации из Свежих правок и Журнала переименований.
На данный момент пока есть только отчет по "Латинице и кириллице" и три пустышки: Участник:Vitalik7/Ошибки
Но в дальнейшем будем добавлять туда новые проверки --Vitalik7 (обсуждение) 03:23, 18 января 2014 (UTC)[ответить]
Коллега, не нужно считать любое смешение латинских и кириллических букв в заголовках статей неверным. Такие статьи как kostь, -ациj, загаhан верные, но некоторые другие нет. Нужно проверять на соответствие алфавиту языка указанного в статье. Для некоторых трудно набираемых букв, похожих на латинские, например "i" и "і" (кiтва), "j" и "ј" (плагиjатор) лучше оставлять перенаправление. Don Rumata 11:24, 18 января 2014 (UTC)[ответить]
Да, я согласен. Это пока просто отчет по смешению символов. Наверное, стоит переименовать "ошибки" в нечто иное.
Касательно других алфавитов нужно будет серьезнее исследовать этот вопрос и доработать алгоритм, чтобы было меньше ложных срабатываний.
Относительно "i" и "j" тоже согласен, это очень даже имеет смысл. Стало быть, нужно добавить такие перенаправления для случаев использования этих символов в качестве кириллических? Есть ли еще подробные случаи, когда перенаправление необходимо оставлять? Надо ли сопровождать его каким-нибудь категоризирующим шаблоном типа "ошибка" или "опечатка"? --Vitalik7 (обсуждение) 14:38, 18 января 2014 (UTC)[ответить]

Значок[править]

Как поставить маленькую закрывающую угловую скобку (>) под буквой? Здесь не смог найти.--Cinemantique (обсуждение) 10:19, 25 ноября 2013 (UTC) .........Похоже, что это ͕, только он не дружит с кириллицей.--Cinemantique (обсуждение) 16:04, 26 ноября 2013 (UTC)[ответить]

Под буквой? Это как? И для чего это нужно? Don Rumata 06:54, 28 ноября 2013 (UTC)[ответить]
Работает, но с русскими кривовато. Основное предназначение МФА, поэтому видимо и не работает. Хотя может быть проблема в конкретном шрифте... --93.81.76.146 11:13, 1 декабря 2013 (UTC)[ответить]
ш͕
Точнее не МФА, а УФА --93.81.76.146 16:32, 1 декабря 2013 (UTC)[ответить]
В общем, нужно использовать правильный шрифт (юникодный) и тогда всё будет ок w:en:Unicode font, w:en:Open-source Unicode typefaces. --93.81.76.146 22:48, 1 декабря 2013 (UTC)[ответить]

Небольшая проблема в оформлении[править]

В теме оформления «Векторное» в левом меню заголовки блоков «Инструменты» и «Языки» с прописной буквы, а «сообщество» со строчной.--Cinemantique (обсуждение) 22:12, 22 ноября 2013 (UTC)[ответить]

 Исправлено. Don Rumata 06:56, 28 ноября 2013 (UTC)[ответить]

Права администраторов, доступ к БД и удаление словарных статей[править]

Два вопроса (простое любопытство). Прочитал в описании mediawiki, что у администраторов есть доступ к БД (только чтение с помощью запросов SELECT), а также, что удалённая страница хранит свою историю изменений и может быть восстановлена. С Викисловарем получается то же самое? Два уточнения: доступ к БД получается прямой или только через веб-интерфейс? Обычные пользователи не могут видеть историю изменений удаленной страницы, верно? --Vitalik7 (обсуждение) 18:51, 22 ноября 2013 (UTC)[ответить]

Русский перевод мягко говоря неточен «Older versions of Mediawiki before 1.11 required you to manipulate the database records within MySQL in order to grant users certain rights.» — В старых версиях Mediawiki до 1.11 для предоставления пользователям определенных прав потребовалось, чтобы администраторы умели работать непосредственно с базой данных MySQL. Теперь для этого есть специальные средства. Администраторы не имеют прямого доступа к базе данных. На второй вопрос ответ — да, администраторы могут просматривать историю изменений удаленной страницы и даже восстанавливать её, а обычные пользователи нет. Don Rumata 19:34, 22 ноября 2013 (UTC)[ответить]
Спасибо! Да, действительно очень странный перевод, в оригинале и правда об этом вообще ни слова. Т.е. у администраторов нет никакого дополнительного доступа к словарным статьям (БД, архив/дампы, доп. фильтры/поиски или что-нибудь еще в этом роде), а только некоторый соответствующий дополнительный функционал по управлению (удаление/восстановление, защита/патрулирование, назначение прав и прочее), верно? --Vitalik7 (обсуждение) 21:42, 22 ноября 2013 (UTC)[ответить]
Возможно, вам пригодится это?--Cinemantique (обсуждение) 22:04, 22 ноября 2013 (UTC)[ответить]
Ух ты! Спасибо, действительно полезная возможность. Жаль только, что эти дампы делаются всего два раза в месяц.
Я работаю над считыванием вики-текстов всех словарных статей в свою локальную БД, а также над скриптами, которые смогут на основании "Свежих правок" обновлять это содержимое и всегда держать БД в актуальном состоянии. Эти дампы могут быть дополнительной проверкой правильности загруженных данных. --Vitalik7 (обсуждение) 22:40, 22 ноября 2013 (UTC)[ответить]
Вы всегда можете сделать дамп страниц из какой-либо категории по запросу на странице Служебная:Экспорт. Don Rumata 23:03, 22 ноября 2013 (UTC)[ответить]
Спасибо, действительно полезная возможность. Однако подход с полным созданием локальной БД все-таки имеет свое преимущество в том, что позволяет легче и быстрее поддерживать постоянную актуальность данных (достаточно лишь обновить содержимое последних статей из "Свежих правок"), а также быстро определять и реагировать на эти свежие изменения. Такой подход будет полезен в таких будущих возможных начинаниях, как автоматическое создание/обновление Индекса, словоформ, списков крассных ссылок, обратного словаря и прочее. --Vitalik7 (обсуждение) 21:36, 24 ноября 2013 (UTC)[ответить]

автоматизация построения возвратных форм[править]

Новый шаблон. Тоже для уменьшения числа вариантов спряжения.

  • {{ся|смотрел}} → смотрелся
  • {{ся|смотрела}} → смотрелась
  • {{ся|смотреть}} → смотреться
  • {{ся|смотри́}} → смотри́сь
  • {{ся|смотрѣлъ}} → смотрѣлся

В общем, -ся после согласных, -сь после гласных.

Годится почти на все случаи жизни, кроме некоторых форм 2 л. мн. ч. пов. накл. (у которых бывает чередование -ти/-ться или -ть/-тись), причастий (у которых всегда -ся, независимо от последней буквы) и деепричастий на -в (у которых возвратного соответствия нет, только -вши/-вшись).

Предложения/замечания? --M. G. J. (обсуждение) 06:24, 22 ноября 2013 (UTC)[ответить]

Не очень понятно, как вы предлагаете реализовывать подобный шаблон? Don Rumata 19:43, 22 ноября 2013 (UTC)[ответить]
Он уже реализован. Шаблон:ся. -- M. G. J. (обсуждение) 20:01, 22 ноября 2013 (UTC)[ответить]
Любопытно. Я давно хочу переписать шаблоны словоизменений на Lua. Можно попробовать этот алгоритм для автоматического формирования форм возвратных глаголов. Don Rumata 00:03, 23 ноября 2013 (UTC)[ответить]

автоматизация чередований в глагольных основах[править]

Вот сделал нечто для уменьшения числа разных подвариантов шаблонов спряжения.

  • простейшее использование:
    • {{чередование|хот}}у → хочу
  • основной предполагаемый вариант использования (после шипящих само ставит другое окончание):
    • {{чередование|хот|ю|у}} → хочу
    • {{чередование|люб|ю|у}} → люблю
  • при отсутствии чередования тоже работает:
    • {{чередование|жен}}ю → женю
    • {{чередование|жен|ю|у}} → женю
  • для глаголов с пометой -щ- (т. е. при чередовании т/щ вместо стандартного т/ч) использовать с 4 параметрами (если 4-й параметр отсутствует или не "щ", то будет по стандарту):
    • {{чередование|обогат|ю|у|щ}} → обогащу
  • или так:
    • {{чередование|обогат|у||щ}} → обогащу
  • аналогично для образования причастий при помете -жд- (имея в виду чередование д/жд вместо стандартного д/ж):
    • {{чередование|род|ённый||жд}} → рождённый

Замечания/предложения? --M. G. J. (обсуждение) 19:05, 21 ноября 2013 (UTC)[ответить]

Можно вопрос немного не по теме? А для написания этих шаблонов используются какие-то дополнительные средства, кроме собственно блокнота? Очень страшно и не понятно на первый взгляд смотрятся строки вида:
-->|з={{#invoke:string|sub|{{{1}}}|1|-2}}ж{{#if:{{{3|}}}|{{{3}}}|{{#if:{{{2|}}}|{{{2}}}}}}}<!--
Легко пропустить где-нибудь скобочку. Составлять и отлаживать шаблоны, наверное, весьма непростое занятие? --Vitalik7 (обсуждение) 21:59, 22 ноября 2013 (UTC)[ответить]
Есть специальные страницы для отладки Служебная:Развёртка шаблонов и Служебная:Песочница для шаблонов. Don Rumata 23:22, 22 ноября 2013 (UTC)[ответить]
Спасибо большое! Действительно с их помощью будет немного проще --Vitalik7 (обсуждение) 21:44, 24 ноября 2013 (UTC)[ответить]
Даже без блокнота, прямо тут в окошке редактировалось. Там на самом деле код простой. Для данной строчки: «(в случае, если у основы последняя буква есть) "з", выведи начальную часть основы (без последней буквы), потом "ж", а потом -- если есть третий параметр, то его, а если третьего нет, но есть второй, то его». --M. G. J. (обсуждение) 14:53, 24 ноября 2013 (UTC)[ответить]
Спасибо большое за разъяснения! Для понимания/написания таких шаблонов явно нужен навык и привычка. Неподготовленному человеку это видится слишком страшным мельтешением фигурных скобок и вертикальных черточек. Смысл я вроде бы улавливаю, однако держать его в голове хотя бы только для этой одной строки получается довольно трудно, постоянно сбиваюсь при подсчете скобок и определении вложенностей, очень не хватает хоть какой-нибудь синтаксической подсветки :) --Vitalik7 (обсуждение) 21:44, 24 ноября 2013 (UTC)[ответить]

Параметр соотв в шаблонах спряжения[править]

Господа, важное изменение в шаблонах спряжения глаголов. Видовые пары глаголов, переданные в параметре соотв= теперь с помощью шаблона {{aslinks}} автоматически преобразуются в ссылки. Параметр соотв-мн= лучше больше не использовать. Если вам необходимо задать ссылку на раздел статьи, то для этого можно использовать обычную викиразметку. Например:

  • |соотв=[[#уреза́ть|уреза́ть]] — для ссылки на раздел внутри статьи, см. урезать
  • |соотв=[[вычитать#вычита́ть|вычита́ть]] — для ссылки на раздел другой статьи, см. вычесть

Во всех остальных случаях разметку добавлять необязательно. Например:

  • |соотв=свить — для ссылки на одну статью, см. свить
  • |соотв=спеть, пропеть — для ссылки на несколько статей, см. петь

Желающие могут заняться заменой соотв-мн= на соотв=. Don Rumata 19:15, 19 ноября 2013 (UTC)[ответить]

Это касается только русских глаголов или и украинских тоже? (я про замену соотв-мн= на соотв=, т.к. в нескольких украинских словах первый вариант также встречается) --Vitalik7 (обсуждение) 14:23, 19 января 2014 (UTC)[ответить]
Это касается только русских глаголов. Don Rumata 13:51, 29 января 2014 (UTC)[ответить]
Спасибо, я так и предположил. Собственно бот уже это исправил и теперь в русских глаголах по идее нигде не используется параметр соотв-мн=.
Однако, возникли некоторые дополнительные моменты в связи с использованием соотв= вместо соотв-мн= (не совсем корректная фраза с множественным числом, выделение лишних слов в виде ссылок и прочее). Это надо дорабатывать глагольный шаблон. Обсуждение зародилось на странице бота: Обсуждение_участника:Vitalik7Bot, там же я разместил некоторые отчеты по этому поводу. — Vitalik7 обс 13:57, 29 января 2014 (UTC)[ответить]

Актуальная лексика (идея для бота)[править]

У меня появилась идея для бота, которую я сам воплотить в жизнь не сумею, но, может быть, появятся желающие сейчас или в будущем. Цель работы — создание списка недостающих статей по материалам современной прессы. Это актуальная лексика, которую читатель может искать не в последнюю очередь и появление которой в Викисловаре может способствовать росту популярности проекта. Как мне представляется, работа может проходить следующим образом: с определённой частотой (например, раз в неделю) бот собирает новые статьи с заранее установленных сайтов СМИ, анализирует их и выбирает слова, статьи о которых отсутствует здесь. Подобную работу я уже видел в английском ВС; если потребуется, поищу ссылки.--Cinemantique (обсуждение) 13:24, 17 ноября 2013 (UTC)[ответить]

Замечательная идея! Мне очень нравится. Я думаю, что когда появится время (скорее всего ближе к декабрю, там у меня немного освобождаются субботы), смог бы попробовать за нее взяться. Если кто-то еще возьмется за эту задачу, то это будет даже лучше, можно либо объединять усилия, либо двигаться параллельно, в любом случае это будет полезно.
Несколько мысле-вопросов по этому поводу:
  1. Таким образом возможно будет ловиться в том числе и профессиональный сленг. В связи с этим (да и не только в связи) вопрос, допустимо ли в Викисловарь добавлять нелитературный профессиональный жаргон? Например, у нас, программистов, очень много устоявшихся слов и выражений, которые часто используются в устной (да и письменной, если это переписка по теме) речи, но литературными их назвать очень сложно, часто это просто кальки с англоязычных терминов.
  2. При простом подходе анализа статей сайтов будет ловиться большое число словоформ. При этом если бы эти словоформы (для известных слов) уже существовали в словаре — было бы проще идентифицировать новые слова. Спрашивал немного ниже, спрошу и здесь: одобряете ли (вопрос ко всему сообществу) идею автоматического добавления известных словоформ в Викисловарь с помощью бота?
  3. Последний момент: скорее всего будут ловиться в том числе и опечатки. Даже если сайт хороший и проверенный, я думаю он не застрахован от появления опечаток в своих статьях. Добавлять слова-опечатки в Викисловарь — казалось бы нонсенс. Но может быть это имеет смысл для некоторых особых случаев? Например, «искуство» редирект на → «искусство» или «мажёр» → «мажор», как это в некоторой степени делают Гугл и Яндекс (понимаю, что у них там заложены соответствующие алгоритмы, но все же).
За любые ссылки по теме был бы, конечно, благодарен. А также стоит подумать, какие сайты можно взять за основу для мониторинга новых слов --Vitalik7 (обсуждение) 18:26, 17 ноября 2013 (UTC)[ответить]
  1. допустимо ли в Викисловарь добавлять нелитературный профессиональный жаргон? — да, мы добавляем все слова, но нужно указывать их лексическую принадлежность шаблонами {{жарг.}}, {{сленг}} и т.п.
  2. добряете ли (вопрос ко всему сообществу) идею автоматического добавления известных словоформ в Викисловарь с помощью бота? — в будущем, когда-нибудь да, но на данном этапе это делать не нужно.
  3. Добавлять слова-опечатки в Викисловарь — казалось бы нонсенс. Но может быть это имеет смысл для некоторых особых случаев? — да, какое-то время мы добавляли явные ошибки с помощью шаблона {{wrongname}}, который собирает их в категории Викисловарь:Ошибки. Об этом есть упоминание в ВС:ПН. Следует учесть, что таким «словам» не место в основном пространстве словаря, и их необходимо заменять перенаправлением в пространство «Викисловарь:Ошибки/». И опять же, создание таких перенеправлений не является целью. Обычно они появляются как замена многократно воссоздаваемых анонимами статей с ошибкой в написании.
Теперь несколько слов по-поводу ботов и поиска слов. Господа, не нужно брать на себя несвойственные нам функции. Мы по большей части используем вторичные источники, т.к. у нас есть требование ВС:ПРОВ. Мы не занимаемся лингвистическими исследованиями. Для этого есть НКРЯ и другие проекты корпусной лингвистики. Don Rumata 08:37, 18 ноября 2013 (UTC)[ответить]
Я считаю, что добавление не статей о формах слов, а редиректов со словоформ - полезно. --- Vesailok 11:32, 18 ноября 2013 (UTC)[ответить]
По поводу ВС:ПРОВ - там есть замечательный пункт "7. результаты поиска в поисковых системах", который очень удобно покрывает случай с новыми словами, которых нет в старых словарях. --Vitalik7 (обсуждение) 14:41, 18 ноября 2013 (UTC)[ответить]
Есть некоторые непонятки (а скорее нежелательность) насчёт слов типа самсунговский, джорджбушевский, Сибнефть… В любом случае не подходят слова, встречающиеся у одного автора (в английском ВС есть также правило о том, что между двумя упоминаниями должен быть временной отрезок не менее года). И лучше сразу отбрасывать всё некириллическое (названия фирм, газет, продуктов).--Cinemantique (обсуждение) 14:52, 18 ноября 2013 (UTC)[ответить]
Пункт 7 нужно бы удалить от греха подальше, заменив на результаты поиска в books.google.com, корпусах текстов и текстах книг онлайн библиотек. Don Rumata 19:54, 18 ноября 2013 (UTC)[ответить]
Каким образом в таком случае предполагается пополнять Викисловарь профессиональным сленгом? --Vitalik7 (обсуждение) 11:37, 19 ноября 2013 (UTC)[ответить]
Возможно, седьмой пункт и следует пересмотреть (но не в рамках данной дискуссии), но чем вам не угодили СМИ? Это не литературный язык? Я считаю, что если какое-то слово было в более или менее устоявшемся употреблении в течение определённого времени в прессе (критерии можно обсудить), то о его значении захочет узнать как нынешний «читатель газет», так и будущие читатели и исследователи. В будущем, конечно, оно может попасть в словари. Но зачем нам ждать? Нужно использовать конкурентное преимущество (хе-хе). И кроме того, если какая-то статья или газета не вошла в НКРЯ, то это проблема корпуса, его полноты и обновляемости; не следует его недостатки экстраполировать на наш проект.--Cinemantique (обсуждение) 15:17, 19 ноября 2013 (UTC)[ответить]
Согласен, крупные новостные источники нужно бы тоже упомянуть, но простой гугл-тест на существование слова многократно себя опроверг. Кстати, в НКРЯ есть газетный корпус. Don Rumata 16:44, 19 ноября 2013 (UTC)[ответить]
  • Действительно, основная трудность в этой работе состоит в том, чтобы не только отсеивать словоформы, представленные в ВС, но и по возможности лемматизировать неизвестные словоформы, т. е. вместо ряда «ретинового, ретиновую, ретиновыми…» хотелось бы на конечном этапе получать в списке только «ретиновый». Я думаю, эта проблема решаема, но нужно приложить некоторые усилия. Отмечу, что конечной целью для бота является формирование списка «красных» ссылок; статьи по ним в дальнейшем создаются (или не создаются, отбрасываются) вручную людьми, которые оценивают соответствие найденных единиц требованиям ВС. Надеюсь, это замечание снимает претензию DonRumata; никакого особенного лингвистического исследования я здесь не вижу (разве что я сам занимаюсь таким исследованием, только очень топорно и на ограниченном пространстве, притом многие «новинки» уже занесены в печатные словари). Список источников можно будет сформировать, когда найдётся желающий заняться этой работой или создать инструмент для неё; издания можно добавлять постепенно, начав с солидных и популярных изданий, для которых характерна новая лексика (но не зашкаливает).--Cinemantique (обсуждение) 13:42, 18 ноября 2013 (UTC)[ответить]
    По поводу "лемматизации" есть очень удобное средство mystem, использовал его в своих скриптах неоднократно. Умеет адекватно работать с неизвестными словами --Vitalik7 (обсуждение) 14:41, 18 ноября 2013 (UTC)[ответить]

Словоформы как отдельные словарные статьи (редиректы) + переносы строк[править]

Не раз встречал на просторах викисловаря словоформы в виде отдельных словарных статей. При этом они просто являются страницами-редиректами на базовую форму слова.
Пример: базовая форма азартный и словоформы азартная азартного азартное азартной азартном азартному азартною азартную азартные азартным азартными азартных — все представлены в полном списке слов Викисловаря
Вопрос 1: Верно ли я понимаю, что это нормальная одобренная практика? Каждое слово имеет право существовать в Викисловаре, в том числе и любая словоформа, правильно?
Вопрос 2: Допускается ли (полезно ли, удобно ли, нужно ли) аналогичное использование всех доступных в словарях словоформ для формирования Индекса, составляемого вручную (либо же автоматическими скриптами на основании других словарей)? Или, возможно, для такого списка лучше сделать отдельные страницы (т.е. Индекс со словоформами и отдельно еще Индекс без словоформ)? Технически это не трудно будет сделать. --Vitalik7 (обсуждение) 11:31, 17 ноября 2013 (UTC)[ответить]

В настоящее время практика такова: При условии отсутствия омонимичных форм (в том числе в других языках) и в случае, если данная форма позволяет с точностью до 100% установить исходную словарную форму, то мы делаем перенаправление. Кроме того, желательно, не только делать редирект, но и указать один или несколько шаблонов Словоформа. Разрешается делать отдельные статьи для словоформ, значительно расходящихся по написанию со словарной формой (пример: ею, её ...), а также для словоформ типа маня, поскольку необходимо шаблоном Cf указать на существование слова Маня. --- Vesailok 13:52, 17 ноября 2013 (UTC)[ответить]
Спасибо за подробный ответ! Несколько уточняющих вопросов:
  1. На данном этапе, если для некоторой словоформы в Викисловаре до сих пор нету ни единой омонимичной конструкции, то можно считать это достаточным, чтобы добавить ее обычным редиректом? (как, например, было сделано для словоформ слова азартный в примере выше)
  2. Сами словоформы, если я правильно понял, можно достать с помощью шаблонов вида Шаблон:гл ru 4c. При этом для каждого способа склонения слов создан отдельный шаблон, который уже проверен временем и в будущем вряд ли подвергнется существенным изменениям (имею в виду ту часть, которая отвечает за таблички словоформ)?
  3. Если делать редирект, то при этом имеет ли смысл все равно добавлять шаблон вида Словоформа? Ведь как правило при редиректе результат этого шаблона никто не увидит (разве что только в случае если пользователь попробует зайти на страницу словоформы, отключив редирект)
  4. Имеет смысл создать 100%-ные редиректные словоформные статьи с помощью бота? (естественно очень тщательно и многократно проверив его и получив одобрение, перед запуском глобального процесса)
Забыл подписаться: --Vitalik7 (обсуждение) 18:27, 17 ноября 2013 (UTC)[ответить]
  • В индексе со словоформами пока не вижу смысла. --Infovarius (обсуждение) 17:34, 17 ноября 2013 (UTC)[ответить]
    Дело в том, что нашел несколько хороших словарей со словоформами и подумал, что для них тоже можно найти место в нашем Викисловаре.
    К тому же, раз уж все словоформы постепенно и так появятся в Викисловаре, то почему бы им точно также не быть и в Индексе, который будет зависеть от содержимого викисловаря? --Vitalik7 (обсуждение) 18:03, 17 ноября 2013 (UTC)[ответить]
Моё личное мнение: словоформы в качестве редиректов в Викисловаре необходимы. Я за то, чтобы создать их ботом. Нужно только помнить, что если "словарный вход" уже существует, то статью-редирект делать нельзя. Кроме того, следует учитывать то, о чём я написал выше. Шаблоны при редиректе прописывают категорию для словоформ. Значит, они нужны, но реализация этого ботом для меня, например, была проблематична. --- Vesailok 20:11, 17 ноября 2013 (UTC)[ответить]
Можно и так: добавить категорию [[::Категория:Словоформы/ru]], [[::Категория:Формы существительных/ru]] и т.д. --- Vesailok 20:22, 17 ноября 2013 (UTC)[ответить]
Всё это давно написано в правиле ВС:ПН. Создавать миллионы словоформ ботом на данном этапе преждевременно. Don Rumata 07:53, 18 ноября 2013 (UTC)[ответить]
Дон, не путайте нас. Речь идёт только о редиректах, а не о полноценных статьях. Тот факт, что мы не договорились о приоритетах, не означает, что редиректы нельзя создавать. --- Vesailok 11:34, 18 ноября 2013 (UTC)[ответить]
Поддерживаю За
В ВС:ПН сказано лишь то, что это не является приоритетной или первоочередной задачей, но тем не менее остается задачей.
Все мы свободные пользователи вики-пространства и вольны выбирать подходящие для нас задачи там, где можем принести бóльшую пользу (главное, чтобы, при этом, конечно, не нарушались принципы соответствующего вики-пространства). Если кто-то может помочь в менее приоритетной задаче, зачем запрещать ему это делать? Так можно несколько лет ожидать пока этот "приоритет" настанет..
Если есть какие-то неопределённые или неутверждённые моменты касательно словоформ — это может быть достаточным аргументом, чтобы не торопиться (но тогда надо просто обсудить эти моменты). Если же всё определено и ясно, то зачем откладывать на потом? К тому же, при необходимости это всегда можно будет с помощью бота изменить (если появятся какие-то новые идеи или требования). --Vitalik7 (обсуждение) 12:24, 18 ноября 2013 (UTC)[ответить]
  • Я не возражаю против массового создания однозначных перенаправлений, но нужно действовать аккуратно и не создавать перенаправлений с неоднозначных омоформ. Каким образом будет сформирован заливочный список? Как будут отсеиваться омоформы? Я также не против отдельного индекса, если он для чего-нибудь будет полезен.--Cinemantique (обсуждение) 13:49, 18 ноября 2013 (UTC)[ответить]
    Кратко по поводу того, как это можно реализовать.
    1. Загружается полный список слов Викисловаря
    2. Для слов, у которых прописаны шаблоны вида {{гл ru 4c}}, формируется список их словоформ (правила формирования четко и строго регламентированы конкретным шаблоном).
    3. Если среди полученных словоформ или уже имеющихся слов есть пересечения, то такие слова претендуют на создание отдельной статьи (омонимичные конструкции). Для начала можно составить полный список таких кандидатов.
    4. Для всех уникальных словоформ создаются страницы с редиректами и с шаблонами типа Словоформа, указывающими способ образования словоформы и базовое слово.
    Технически все возможно, но с формированием списка словоформ на основании шаблонов придется повозиться. Может быть получится заняться этим (среди всего прочего) в декабре. --Vitalik7 (обсуждение) 14:30, 18 ноября 2013 (UTC)[ответить]
  • Боюсь, наличие шаблона на странице будет препятствовать действию редиректа (перенаправление не осуществится). Нужно ставить категорию, скорее всего.--Cinemantique (обсуждение) 14:43, 18 ноября 2013 (UTC)[ответить]
    Ок, хорошо, с категорией даже проще будет --Vitalik7 (обсуждение) 14:47, 18 ноября 2013 (UTC)[ответить]
    Абсолютно поддерживаю план, саи такой в голове держу. Единственное, что может сдерживать (и возможно один из аргументов Руматы) - у многих слов не заполнены указанные шаблоны, а значит их не получится разложить на словоформы. Впрочем, это не препятствие - можно регулярно проверять: у какого слова появился шаблон - разложить на словоформы. P.S. Шаблон не мешает перенаправлению, если он стоит после ключевого слова REDIRECT: азартного. При этом шаблон считаю предпочтительнее категорий, т.к. можно указать много дополнительной информации и категории формируются автоматически. --Infovarius (обсуждение) 17:53, 18 ноября 2013 (UTC)[ответить]
    Что-то я в ВС:ЛК не наблюдаю в задачах Викисловаря создание миллионов перенаправлений для форм слов. Может лучше пока поиграться с формами слов в каком-нибудь другом проекте. Задача словаря в первую очередь дать толкование. Пока даже не все лексемы русского языка описаны, не говоря об украинских или английских. Куда не ткну сплошные болванки, которые насоздавали ботами. Don Rumata 21:04, 18 ноября 2013 (UTC)[ответить]
    1) словоформа не является лексической единицей? 2) английский и французский раздел создали не то что редиректы, а даже статьи по всем словоформам, и не парятся. 3) между прочим, это удобно - когда будут созданы редиректы, можете просто окружать скобками слово в тексте: насоздавали :) --Infovarius (обсуждение) 12:57, 19 ноября 2013 (UTC)[ответить]
    Я не понимаю, как предлагаемая работа может ухудшить существующие болванки. И сравнение не совсем корректно: залитые болванки требуют улучшения, в то время как редиректы вроде бы в улучшении не нуждаются. Вы хотите сказать, что нам нужно заставить направить участника Vitalik7 к более приоритетной работе? Но, может быть, он её делать не хочет или не может. (Вы же, Дон, не хотите делать категоризацию по морфемам, и я не знаю, как вас направить к этому.) А среди участников крайне желательно иметь не только тех, кто добавляет толкования, но и программистов, дизайнеров (здесь на память приходят стихи Михалкова).--Cinemantique (обсуждение) 15:33, 19 ноября 2013 (UTC)[ответить]
    Давайте вы на моей СО напишите, как вы предлагаете делать категоризацию по морфемам, и я сделаю прямо сейчас. Мне не трудно. Я никого ни к чему не понуждаю. Просто я знаю реакцию читателей, когда они приходят на болванку. Да вы и сами наверно видите, какие в этом случае оставляют комментарии. Писать толкование, искать примеры, это работа. А включить бота и создать им миллион редиректов никакой работы не требует. И никакой пользы для читателя в этом нет. Наверно вы знаете, что когда вы набираете слово в строке поиска Викисловаря, то происходит быстрый поиск не только по статьям, но и по редиректам. И вместо десяти лексем в выпадающем списке вы получите десять словоформ одного слова. Don Rumata 16:26, 19 ноября 2013 (UTC)[ответить]
    Нужно признать это явление либо абсолютным злом и запретить, удалить, либо нужным и полезным — тогда почему не залить? Разве здесь дано третье? То есть такое: пусть некоторые редакторы время от времени создают вручную такие редиректы (замечу, тратя своё время, которое можно было направить на болванки и новые статьи) или на них заменяются статьи, созданные по ошибке случайными редакторами, но залить всё и сразу — ни-ни. Как-то странно. Проблема словоформ в поиске действительно имеется. Возможно ли как-то решить её через настройки (не показывать перенаправления)? Польза, наверное, есть для тех, кто ищет слово по форме, не зная словарную. Да, можно обнаружить в результатах поиска, но так быстрее.--Cinemantique (обсуждение) 16:58, 19 ноября 2013 (UTC)[ответить]
    Небольшое, но важное замечание касательно поиска. Попробуйте, например, какие варианты предлагаются во всплывающем списке при последовательном вводе букв слова "азартного" в строку поиска. Ни одна из словоформ не попадает в результат выдачи до тех пор, пока не будет введено "азартно". Мало того, слово "азартного" появляется только при вводе "азартног". Аналогичная ситуация и с другими редиректами-словоформами, например, для "Абхазия" или "абитуриентка". Словоформы-редиректы начинают появляться в выдаче только в самый последний момент. И никаким образом не мешают и не путают пользователя. Наоборот: помогают быстрее найти нужное слово, если мы вводим словоформу (например, скопировали в буфер обмена из какого-нибудь сайта и хотим быстро найти его в Викисловаре)
    Для информации, страниц-редиректов на данный момент в Викисловаре более ста тысяч и абсолютное большинство из них — словоформы. Абсолютно согласен с Cinemantique, создавать все эти редиректы — это ведь титанический труд, зачем его продолжать делать вручную, если можно поручить боту?
    "А включить бота и создать им миллион редиректов никакой работы не требует" — а вот такое очень обидно услышать. Позвольте с вами в корне не согласиться. Не знаю, почему у вас такой зуб на программистов, но их работа, поверьте, тоже весьма и весьма не простая. Одно дело — запустить уже готовый, кем-то написанный бот, и сооовсем другое дело — написать этого бота самому, да еще и чтобы другие могли его использовать. --Vitalik7 (обсуждение) 18:19, 19 ноября 2013 (UTC)[ответить]

Снова про слоги[править]

  • шаблон считаю предпочтительнее — тогда желательно, чтобы бот и заполнял эту информацию. И нужно определиться с необходимыми полями (слогоделение вроде бы не нужно).--Cinemantique (обсуждение) 15:38, 19 ноября 2013 (UTC)[ответить]
    Я считаю, чем полнее информация тем лучше. Это делает данные о слове наиболее полными, и всю её потом можно будет использовать. Думаете, роботы не хотят знать, как произносится слово в другом падеже и как его словоделить? :) --Infovarius (обсуждение) 07:20, 21 ноября 2013 (UTC)[ответить]
    Тогда мне интересно, как бот будет это делать (делить на слоги). ;)--Cinemantique (обсуждение) 08:28, 21 ноября 2013 (UTC)[ответить]
    Гм.. Я уж было начал писать большое сообщение, что это действительно очень сложная задача и т.п.. А потом задумался, а такая ли она неподъемная.. В принципе ударения уже будут расставлены на основании словообразовательных шаблонов, боту же останется только определить, где нужно разбить слово на слоги (при этом у него уже будет информация о разбиении на слоги базового слова). Тут, конечно, тоже есть ряд подводных камней и этот вопрос нужно исследовать очень тщательно. Но может быть все окажется не так уж и сложно? И принципы словоделения не так уж и запутанны? Например, если в простом виде, то «каждый слог содержит ровно одну гласную, и может заканчивается либо на гласную (аоеент), либо если подряд идет несколько согласных, то захватывает все, кроме последней (вок-зал, а-зарт-но-го)». Я отдаю себе отчет, что сейчас очень сильно упростил задачу и не учел много разных случаев и поэтому был бы благодарен за любую информацию по этому поводу. Если получится реализовать это словоделение для словоформ, то такой же принцип, наверное, можно будет попробовать применить и для автоматизированного добавления словоделений в основные статьи с помощью бота, как вы думаете? --Vitalik7 (обсуждение) 09:56, 21 ноября 2013 (UTC)[ответить]
    Здесь для меня встаёт проблема «трёх сестёр»: слово можно разбить для переноса тремя равнодопустимыми способами (се-стра, сес-тра, сест-ра). Что касается собственно слогоделения, то его принципы здесь мало кому известны и мало кем соблюдаются (верен только один способ — се-стра, но кон-тракт), а для бота делить на слоги — это, по-моему, невыполнимая задача. Подробности по указанным ссылкам.--Cinemantique (обсуждение) 11:44, 21 ноября 2013 (UTC)[ответить]
    Спасибо большое за ссылки! Как интересно все получается. Много из школы вспомнилось. Задача действительно не такая простая, как могло показаться сначала..
    По поводу трех сестёр, мне кажется раз возможны три варианта деления, то логично было бы все эти три возможных варианта в Викисловаре и указывать, как считаете?
    По поводу невыполнимости задачи.. Если делать ее полностью автоматической — то да, это весьма и весьма сложная задача, ибо бот должен стать слишком интеллектуальным, он по сути должен уметь правильно предполагать деление слова на морфемы, а это часто может быть слишком непросто.. Но что если сделать ее просто автоматизированной? Т.е. бот может предложить для списка слов свои варианты разделения на слоги. Человек может пройтись по этому списку, вычитать его и (если алгоритм получится хороший) большую часть одобрить, а некоторые исправить. После этого бот автоматически заносит все предложенные и исправленные варианты в словарные статьи. Это будет гораздо быстрее, чем добавлять слогоделение в каждую статью по отдельности. К тому же бот поможет найти все слова без слогоделения, чтобы легче с ними было разобраться.
    В дальнейшем можно будет подумать над похожими механизмами некоторой "автоматизированной помощи" и для других разделов..
    Что скажете? :) --Vitalik7 (обсуждение) 12:25, 21 ноября 2013 (UTC)[ответить]
    Мне тут видится громадная вычитка, которую никто не захочет делать. Но она и не потребуется, если мы решим вопрос о назначении шаблона «по-слогам» в пользу переносов с необходимостью указания всех вариантов. А для построения всех вариантов переноса слова существуют специальные алгоритмы. Я, к сожалению, не знаю, где их брать и как применять; надо у Дона Руматы спросить или погуглить. Скажите, а с заполнением остальных параметров бот справится?--Cinemantique (обсуждение) 12:45, 21 ноября 2013 (UTC)[ответить]
    Слава этих алгоритмов несколько преувеличенна: они основаны не более чем на компактной записи эталонного словаря переносов и их качество словарем полностью определяется. Для слов вне такого словаря результат может оказаться плохим. А сам шаблон, несомненно, надо переименовать в "переносы" и не бояться чего-то типа "цар-ст-во". --M. G. J. (обсуждение) 13:21, 21 ноября 2013 (UTC)[ответить]
    Может, так: ца-[рст]-во? Последовательность в скобках, а также любая её часть может быть отнесена как влево, так и вправо. Потребуется дополнительная инструкция. А что вы думаете о переносе этой информации в отдельный раздел?--Cinemantique (обсуждение) 14:38, 24 ноября 2013 (UTC)[ответить]
    Тоже вариант. Но, кажется, он с одной стороны переусложненный (из-за скобок), а с другой -- смешивает "хорошие" и "плохие" переносы в кучу. Вот нарисовать бы такую шоколадку с заготовками для деления на кусочки:
             +---+--   -       -   --+---+
             |      \_/ \  /\_/ \ /      |
             | ц   а   р |/с   т | в   о |
             |           |               |
             +---+---+---+---+---+---+---+
  • (типа: чем лучше перенос, тем глубже надрез). ;-) --M. G. J. (обсуждение) 15:04, 24 ноября 2013 (UTC)[ответить]
    А касательно отдельного раздела -- сейчас эта информация воспринимается не как часть раздела, а скорее как заголовок, которых хочется видеть покрупнее и над всеми разделами. С заголовками для омонимов идеально совмещается. -- M. G. J. (обсуждение) 15:11, 24 ноября 2013 (UTC)[ответить]
    Ох, не хотелось бы мне такую «шоколадку» в статье увидеть, да ещё в морфологии. :) С точки зрения современных рекомендаций, эти переносы равнодопустимы, но менее предпочтительны варианты с разбитой приставкой и переносом на месте дефиса. А зачем видеть словопереносы покрупнее, неужели они жизненно необходимы? Заголовок есть у статьи. Вот ударение разве что. Особенно у глаголов, не имеющих инфинитива в таблице.--Cinemantique (обсуждение) 15:24, 24 ноября 2013 (UTC)[ответить]
    Заголовок у статьи -- он где-то там высоко-высоко, часто уже и не на экране. А хотелось бы видеть обсуждаемое слово рядом с началом текста словарной статьи. И переносы дешевле всего иметь прямо проставленными на самом этом слове, а не вынесенными куда-то в какие-то отдельные подразделы. (А тогда эти подразделы в массе своей вообще будут не нужны, если только в переносах нет особенностей, которые надо оговорить отдельно.) В общем, предложение такое: после заголовка первого уровня ("русский язык") всегда (а не только при наличии омономов) ставить заголовок второго уровня, в котором прописывать слово с ударением и переносами. А дальше уже всю морфологою-фонетику-семантику и прочее. Переносы же указывать, наверное, не дефисами (чтобы не путать с дефисами в составе слова), а точечками: ге⋅не⋅ра̀л-гу⋅бер⋅на́⋅тор. --M. G. J. (обсуждение) 10:26, 27 ноября 2013 (UTC)[ответить]
    А у меня содержание в свёрнутом состоянии, и поэтому заголовок почти всегда под носом. Тут видятся вот какие проблемы: 1) такие заголовки будут странно смотреться в содержании (у тех, кто его не свернул); 2) у омонимов ставится ударение, когда оно разграничивает их; если ударение будет всегда и везде, то такое разграничение сделать не получится. И опять-таки: мне не нравится безальтернативность переноса. Как будет решаться «проблема трёх сестёр»?--Cinemantique (обсуждение) 10:43, 27 ноября 2013 (UTC)[ответить]
    И даже у вас он под носом только для самого верхнего значения в самом верхнем языке. На 1): можно оформить не как HTML-/wiki-заголовок, а как абзац текста, выглядящий похоже на заголовок (шрифт крупнее, чем у подзаголовков нижних уровней). На безальтернативность: се⋅с⋅т⋅ра̀. --M. G. J. (обсуждение) 11:05, 27 ноября 2013 (UTC)[ответить]
    Не уверен пока насчёт заголовка, но вариант записи считаю приемлемым. То есть читается так: в любом месте, где стоит точка можно сделать перенос. Можно ещё точки по-разному выделять как нежелательное (красным?). Согласен также насчёт отказа от чёрточки в пользу чего-то другого (точки, например, или палки с разрывом), она мешает в словах с дефисом.--Cinemantique (обсуждение) 11:31, 27 ноября 2013 (UTC)[ответить]
    се⋅ст⋅ра́-хо⋅зя́й⋅ка? -- M. G. J. (обсуждение) 12:55, 27 ноября 2013 (UTC)[ответить]
    В руководствах такие случаи не упоминаются, но лучше предупредить, наверное. Даже так: се⋅ст⋅ра́-хо⋅зя́й⋅ка, поскольку рекомендуется избегать переносов на месте дефиса.--Cinemantique (обсуждение) 13:05, 27 ноября 2013 (UTC)[ответить]
    Тогда уж так: се⋅ст⋅ра́-хо⋅зя́й⋅ка. (Впрочем, тут как раз дефис отмечать не надо было: это не абсолютно запрещенный перенос, как в "они-с едут 1-м классом".) -- M. G. J. (обсуждение) 13:24, 27 ноября 2013 (UTC)[ответить]
    С заполнением остальных параметров бот справится? — если речь о род, число, падеж и прочее, то да, должен справиться. Это, правда, будет довольно непросто изучить все шаблоны словоизменений и соответствующие для словоформ, но я постараюсь.
    Мне тут видится громадная вычитка, которую никто не захочет делать. — а мне казалось, что один раз вычитать — это гораздо проще и быстрее, чем для каждого отдельного слова потом задумываться. При чем эту "вычитку" можно делать по частям, сколько получилось, столько и одобрить, потом другой человек тоже еще какую-то часть проверит, и потом еще. И так в итоге покрыть со временем все слова.
    Слава этих алгоритмов несколько преувеличенна — а можете дать ссылки на них для изучения? Если есть словарь переносов, то может и бот сможет им в каких-то случаях воспользоваться? --Vitalik7 (обсуждение) 18:22, 22 ноября 2013 (UTC)[ответить]
    Алгоритм тут: http://tug.org/docs/liang/ Исходные словари переносов где искать -- заранее не знаю, но подготовленные из них базы данных для алгоритма, например, тут: http://www.tex.ac.uk/CTAN/languages/hyphenation/ruhyphen/ (обратно по базе восстановить исходный словарь нельзя). --M. G. J. (обсуждение) 20:21, 22 ноября 2013 (UTC)[ответить]
    Спасибо! Правда, к сожалению, малопонятно.. Кстати, а о каком таком вопросе о назначении шаблона «по-слогам» шла речь выше? --Vitalik7 (обсуждение) 22:01, 22 ноября 2013 (UTC)[ответить]
    Речь шла о том, чтобы вместо не вполне понятных "слогов" (то ли фонетических, то ли орфографических) использовать этот (или переименованный) шаблон исключительно для указания мест возможных переносов. --M. G. J. (обсуждение) 14:30, 23 ноября 2013 (UTC)[ответить]

┌───────────────────────────────────────┘
Мы же вроде решили, что {{по-слогам}} используется только для деления по слогам, а не для переносов. Обсуждали несколько раз. Викисловарь:Лингвистические и лексикографические вопросы/2011#Деление по слогам или правила переноса слов, Викисловарь:Лингвистические и лексикографические вопросы/2012#Слоги в транскрипции, Викисловарь:Организационные вопросы#Слогоделение. Пора это внести в ВС:ПОС. Только нужно определиться, какую теорию слогоделения принять за основную. Don Rumata 21:05, 23 ноября 2013 (UTC)[ответить]

Прочитал. Видно, что ничего не решили, а вопрос так и висит. Более внятные аргументы в пользу того, чтобы фонетическое деление указывать в транскрипции, а тут — переносы. --M. G. J. (обсуждение) 21:34, 23 ноября 2013 (UTC)[ответить]
P. S. Про алгоритм Христова, кстати, полная ерунда. Он был в свое время сделан по бедности и в приличной издательской деятельности не используется. А в приличных системах стоит алгоритм Ляна, на который ссылка была выше. И для которого нужны эталонные словари переносов. Поэтому (раз мы тут словарь и составляем) переносы надо ставить вручную. Никакой алгоритм 100%-но правильно в неологизмах переносы не поставит. Условно говоря, надо уметь разбираться, где "био-вал", а где "би-овал" . --M. G. J. (обсуждение) 21:34, 23 ноября 2013 (UTC)[ответить]
В слове би-о-вал три слога. Don Rumata 07:19, 28 ноября 2013 (UTC)[ответить]
Речь не про них, а про перенос. -- M. G. J. (обсуждение) 07:52, 28 ноября 2013 (UTC)[ответить]
Шаблон называется {{по-слогам}}. Фраза «границы слогов, не подходящие к разделению слова, указываются с помощью точки» на странице документации не значит, что шаблон предназначен для указания переносов. В своё время никто не удосужился об этом написать в ВС:ПОС. Все мои попытки хоть как-то выработать консенсус по использованию этого шаблона потонули в дебатах о выборе предпочтительной теории слогоделения. Это очень важный вопрос, но это не значит, что шаблон {{по-слогам}} нужно использовать для указания орфографически правильных переносов. Правила переносов намного проще чем правила выделения границ слога. Если бы мы хотели использовать шаблон для указания переносов, то давно бы так и сделали. Don Rumata 08:46, 28 ноября 2013 (UTC)[ответить]
Речь не про шаблоны. Не про слоги. А про перенос как таковой. Что это не техническая мелочь, которую можно свалить на какие-то алгоритмы, а важная словарная информация. Связанная и с произношением, и с морфологией, и с семантикой, и даже с психологией-эргономикой. -- M. G. J. (обсуждение) 08:59, 28 ноября 2013 (UTC)[ответить]
Почитал Обсуждение шаблона:по-слогам. Первоначально его создал аноним, который им задумывался для переноса по слогам. Уж не знаю как так получилось, но указание деления слова есть и в других разделах Викисловаря. Немцы указывают перенос слов в отдельном разделе "Worttrennung". Французы указывают деление на слоги в транскрипции используя знаки МФА. В некоторых языках есть особые правила переноса. В том же немецком есть устаревший вариант переноса de:Zucker → Zuk-//ker, в нидерландском nl:reëel → re-//eel. Всё оформление статьи у нас универсально. Сейчас у нас в разделе «Морфологические и синтаксические свойства» указывается лемматизированная форма слова. Её оформление производится внутри морфологических шаблонов. Кто решил использовать параметр слоги= я не знаю. Что делать если лемматизированная форма и перенос различаются, как в нидерландском, я не знаю. Don Rumata 10:21, 28 ноября 2013 (UTC)[ответить]

Шаблоны словоизменений[править]

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.


|ПричСтрад  = —<!--{{qif|test={{{НП|}}}|then=-|else={{{основа}}}и́мый}}-->
В строках такого вида всё, что находится между "<!--" и "-->" является комментарием и может быть проигнорировано, верно? --Vitalik7 (обсуждение) 21:54, 24 ноября 2013 (UTC)[ответить]
  • Правильно ли я понимаю смысл этого кусочка: {{{основа1|{{{основа}}}}}} — попробовать вставить значение параметра "основа1", а если его нету (он пуст), то тогда использовать параметр "основа"? --Vitalik7 (обсуждение) 23:43, 24 ноября 2013 (UTC)[ответить]
    • Вероятно, вам будет полезны страницы: w:Википедия:Механизм шаблонов и w:Википедия:Функции парсера.--Cinemantique (обсуждение) 08:35, 25 ноября 2013 (UTC)[ответить]
    • Да, вы правильно понимаете. Но я бы не стал получать список форм слова из внутренностей шаблона словоизменения, легче из готового html-текста, мне кажется. --Infovarius (обсуждение) 11:15, 25 ноября 2013 (UTC)[ответить]
      Гм.. Момент спорный.. Если брать готовый html-текст шаблонов, то там не видны будут детали принятия того или иного решения (встречаются #if).
      Если же брать готовые html-тексты всех словарных статей, то мне тут видится две трудности:
      1. Объем вики-текстов для русских слов уже получился где-то 800Мб, а для всех языков 1,3Гб. Если же попытаться загрузить html-тексты (которые значительно превышают по объему wiki-текст), то общий объем возрастет в несколько раз.
        К тому же, загружать вики-тексты можно с помощью удобной библиотеки pywikibot (это уже проделано, и все вики-тексты теперь хранятся в локальной БД, по которой можно легче производить поиск), а html-страницы пришлось бы парсить и загружать вручную.
      2. Парсить html будет гораздо сложнее, чем компактный строго-структурированный вики-текст. Для html-варианта надо будет идентифицировать подходящий языковой раздел (по заголовку), идентифицировать соответствующую таблицу словоизменений, идентифицировать использованные строки в этой таблице и прочее. Также не так просто будет определять некоторые параметры базового слова.
        Для вики-текстов есть правда другие трудности (надо тщательно изучить шаблоны), но зато подход получается более надежный и универсальный. Если обработать все шаблоны (в полу-автоматическом режиме), то будет безошибочный алгоритм по образованию словоформ. Трудность как раз в этой обработке..
      Что в результате окажется проще — это пока еще вопрос открытый, но т.к. я уже начал действовать по варианту с вики-текстами, то постараюсь пока с ним и продолжить..
      А вообще задача оказалась несколько сложнее, чем я думал. Количество шаблонов словоизменения многие и многие сотни (только лишь для глаголов их уже более 500) и они, к сожалению, не все так просты и однотипны, как хотелось бы. Встречаются проверки #if, встречаются включения одного словоизменительного шаблона другим, запись столбцов таблицы иногда происходит в разной манере и прочее.. Но задача все равно пока решаемая. Только получается более трудная и требующая бо́льшего времени. --Vitalik7 (обсуждение) 12:55, 25 ноября 2013 (UTC)[ответить]
      Если вы разберётесь во многих шаблонах словоизменения (читай: станете экспертом), можете по пути их универсализировать - и всем от этого удобнее будет. --Infovarius (обсуждение) 03:54, 26 ноября 2013 (UTC)[ответить]
      Гм.. А это и правда интересная мысль.. Ведь действительно так выходит, что пока я пишу этот скрипт по считыванию информации из шаблонов словоизменений, мне приходится досконально изучать их общие и отличающиеся черты, а также назначение ключевых параметров.. Но тогда такие вопросы:
      1. Быть может у кого-то уже были какие-то идеи по поводу упрощения или универсализации этих шаблонов, но просто не доходили руки?
      2. Есть ли где-то единая информация по этой классификации Зализняка, а также по использованию и выбиранию этих шаблонов для словарных статей (может какая-нибудь инструкция или общие моменты)? Или пока что каждому, кто захочет их использовать, нужно разобраться самостоятельно и выбирать на свой страх и риск?
      3. В каких границах мне разрешается производить эту самую универсализацию? Можно пробовать делать некритические изменения самостоятельно, а если же есть какое-нибудь немаленькое предложение по изменению, то предлагать здесь и изменять после обсуждения?
      --Vitalik7 (обсуждение) 13:22, 26 ноября 2013 (UTC)[ответить]
      Об объединении шаблонов лучше предварительно сообщать. В ВС о классификации Зализняка можно прочесть здесь и далее по ссылкам на глаголы и существительные. Более подробно ознакомиться с ней можно во вступительной части «Грамматического словаря русского языка» Зализняка. По моим ощущениям, в упрощении нуждаются глагольные шаблоны; об этом говорил участник soshial, см. Викисловарь:Организационные вопросы#Модификаторы/суффиксы для шаблонов спряжения русского языка.--Cinemantique (обсуждение) 14:14, 26 ноября 2013 (UTC)[ответить]
      Спасибо большое за ссылки! Словарь Зализняка скачал (ох и много же там информации по этой классификации), сведения в викисловаре по шаблонам словоизменения нашел (только она не везде полная пока получается). обсуждение по глаголам увидел. Загрузился пока предостаточно.. глубокая тема. --Vitalik7 (обсуждение) 18:49, 26 ноября 2013 (UTC)[ответить]
  • Есть небольшая просьба-предложение. Почему бы не переименовать шаблоны существительных из такого вида {{сущ ru f ina 2b}} и {{сущ ru n a 4a}} в такой: {{сущ ru ж неод 2b}} и {{сущ ru ср одуш 4a}}? Было бы гораздо понятнее и читабельнее (род и одушевленное/неодушевленное писать на русском), ведь часть речи мы на русском пишем, да и все остальные шаблоны тоже. А то эти "f ina" и "n a" сильно сбивают с толку, особенно с последующей классификацией ("a 4a" смешивается в сознании). --Vitalik7 (обсуждение) 19:06, 26 ноября 2013 (UTC)[ответить]
Можно как у Зализняка: «сущ ru ж 2b», «сущ ru жо 2b», «сущ ru м 2b», «сущ ru мо 2b» (то есть если неодушевлённое, то ничего не добавляем, а если одушевлённое, добавляем «о»). Но я уже привык, и меня не напрягает. Кроме глаголов: все эти СВ, и -ся, и -л. Впрочем, я редко создаю статьи о глаголах, наверно, поэтому…--Cinemantique (обсуждение) 19:14, 26 ноября 2013 (UTC)[ответить]
(пока писал это сообщение, появилось новое, поэтому размещаю его под новым)
Очень бы хотелось, чтобы все было выдержано в едином стиле. Это я сейчас не как программист говорю (программе абсолютно не важно как шаблон называется), а с человеческой точки зрения, с позиций удобства использования, понятности и красоты записи.
В словаре Зализняка используется обозначение "мо" для "м одуш" и "м" для "м неод", можем поступить так же, но варианты "м одуш", "м неод" хоть и длиннее, но понятнее и красивее.
Аналогичное предложение по поводу глаголов. В словаре Зализняка пометки "св/нсв" идут до знаков классификации, может и мы сделаем так же? Т.е. вместо {{гл ru 2bСВ}} назовем так: {{гл ru св 2b}}. Будет более сходно с именованием шаблонов для существительных. При этом просто {{гл ru 2b}} станет {{гл ru нсв 2b}} (т.е. явно указывать "нсв"; мне, например, не совсем понятно, зачем несовершенный вид считать видом по умолчанию) --Vitalik7 (обсуждение) 19:22, 26 ноября 2013 (UTC)[ответить]

Еще некоторые мысли уже по поводу самого содержимого шаблонов словоизменения.
В целом можно выделить два противоположных подхода:

  1. Для каждого конкретного случая отдельно прописывать варианты склонения/спряжения
  2. Пытаться находить похожие моменты, объединять шаблоны, делать проверки внутри и прочее

С точки зрения программной обработки всех этих шаблонов первый способ гораздо выгоднее и проще. Также он проще для людей, являющихся составителями и редакторами этих шаблонов (второй способ иногда может быть более труден для понимания, он более сложный в содержимом шаблонов, в нем легче допустить ошибку, труднее сопровождать). В основном для большинства шаблонов применяется именно первый способ, но иногда (довольно редко, но встречается) применяется и второй.
У меня есть предложение повсеместно использовать именно первый вариант. Понимать, сопровождать людям его легче. И автоматически проанализировать скриптами для формирования словоформ также будет гораздо проще.
Если поддерживаете, то я тогда буду избавляться в шаблонах от проверок вида #if (в пользу создания нового шаблона), а также от включения одним словоизменительным шаблоном другого (по моим предварительным наблюдениям это встречается редко; здесь имеется в виду не использование дополнительных служебных шаблонов, а именно включение одного результирующего другим результирующим). На использовании шаблонов для формирования словарной статьи это принципиальным образом никак не отразится. --Vitalik7 (обсуждение) 19:42, 26 ноября 2013 (UTC)[ответить]

  • Два момента. Систему шаблонов создавал и изначально продумывал Эл Силонов, поэтому необходимо его мнение по системным изменениям. ИМХО, названия и содержимое шаблонов должно стремиться к понятности и универсальности. Во-вторых, если я правильно понял второй подход, он может быть полезен, чтобы указать и использовать преимущества иерархической структуры спряжений и склонений. Т.е., например, {{сущ ru f ina 2b}} должен вызывать {{сущ ru f ina}}, который вызывает {{сущ ru f}}, который основан на базовом {{сущ ru f}}. Тогда, скажем, в первом уже не надо писать "существительное, женского рода, неодушевлённое", т.к. это вставляют классы шаблоны-предки. --Infovarius (обсуждение) 08:43, 27 ноября 2013 (UTC)[ответить]
    • С точки зрения алгоритма формообразования должно быть не так: базовый шаблон типа {{сущ ru f 1a}}, а поверх него {{сущ ru f ina 1a}} (а то и просто {{сущ ru f 1a|одуш=ina}}). Потому что сложнее всего построить словоформы, а описательные фразы приклеваются совершенно формальным образом. Вот чем отличается "f ina 2b" от "f a 2b"? Только двумя моментами: словом в описании и одной формой в таблице (вин. мн. брать из им. мн. или из род. мн.); поэтому их надо растить из некоего общего предка "f 2b" (в котором формы вин. мн. может не быть вообще). Я в этом духе сейчас пытаюсь делать глагольные шаблоны для старой орфографии, см. {{гл ru-old 1a}} и {{гл ru-old 2a}}. Вообще в идеале шаблон должен быть один для одного языка: если у Зализняка написано "зерно́ с 1*d, ё" -- то чтобы и вызов был не сложнее {{слово/ru|зерно́|с|1*d|ё}}. --M. G. J. (обсуждение) 10:52, 27 ноября 2013 (UTC)[ответить]


Попробую ответить сразу на два последних сообщения и донести свое видение ситуации.
К шаблонам словоизменения можно подходить с различных сторон:

  1. C точки зрения использования готовых шаблонов:
    1. С точки зрения выбора подходящего шаблона для создания новой словарной статьи (или добавление шаблона в существующую болванку)
      • Тут мне видится, что было бы идеально, если бы именование шаблонов было максимально приближено к написанию, использованному в словаре Зализняка.
        • В этой связи предложение заменить "сущ ru f a 1a" на русскоязычный аналог: "сущ ru ж одуш 1a" (более наглядно и понятно) или "сущ ru жо 1a" (так используется у Зализняка)
        • Аналогично с глаголами: именовать шаблоны в таком стиле: "гл ru св 2b" или "гл ru нсв 2b"
        • Это просто идея, как она будет реализована в итоге не важно, можно и так: "слово/ru|зерно́|с|1*d|ё" (как предложил выше Участник:M. G. J.)
        • Здесь получается важно услышать мнение основателя шаблонов словоизменения Участник:Al Silonov
    2. C точки зрения просмотра исходного вики-текста существующей словарной статьи (с уже использованным шаблоном словоизменения)
      • В принципе все аналогично. Чем более приближенно будет написание к системе Зализняка, тем бо́льшее количество людей смогут без особых проблем использовать эти шаблоны и тем меньшее время будет требоваться для того, чтобы разобраться в них.
    3. С точки зрения просмотра готового результата использования шаблона
      • Тут уже абсолютно все равно, как мы называли и реализовывали шаблоны — конечный результат будет показан пользователю один и тот же.
    • По сути с точки зрения использования шаблонов конечным пользователям абсолютно не важно, как они устроены внутри, главное, чтобы можно было по названию понять, что он значит, а также с наименьшим количеством усилий выбрать подходящий шаблон для нового слова
  2. С точки зрения создания/редактирования шаблонов:
    • Для начала сразу оговорюсь, что абсолютно согласен с очевидной идеей, что конкретные шаблоны словоизменения используют для формирования результата некоторые более базовые шаблоны. Не вполне согласен только лишь с некоторыми идеями реализации этой задумки, но об этом ниже
    1. С точки зрения первичного создания шаблонов
      • По-началу кажется, что удобнее использовать такие возможности формирования шаблонов, как:
        • включение одних шаблонов другими (предложенная выше идея общего предка для "f ina 2b" и "f a 2b", т.к. они слабо отличаются между собой)
        • разнообразные проверки #if внутри шаблонов и выбор подходящего варианта словообразования в зависимости от тех или иных значений определенных параметров
      • Признаюсь, что у меня первой мыслью, когда я открыл словарь Зализняка, был точно такой же подход, однако потом я поменял свое мнение, но об этом ниже
    2. С точки зрения сопровождения шаблонов (добавление/исправление)
      • Предложенная выше идея сильно проигрывает при необходимости что-то исправить в шаблоне потому что:
        • Постороннему человеку, желающему вникнуть в реализацию шаблонов с целью внести некоторое исправление (вдруг где-то ошибка или просто нужно важное нововведение), придется потратить большое время на то, чтобы вникнуть во взаимосвязи и реализацию шаблонов
        • Самому автору шаблонов спустя долгое время (месяцы или годы) также придется потратить немалое время, чтобы вспомнить и вникнуть в детали реализации
        • Наличие связей между результирующими шаблонами делает их более зависимыми. Не так просто становится изменение отдельного шаблона, если теоретически это может затронуть еще ряд других шаблонов
        • Ро́боту построить словоформы на основании таких сложных шаблонов будет весьма и весьма непросто, но об этом напишу подробнее ниже в отдельном подпункте
      • Мне очень нравится текущий вариант реализации шаблонов, когда для каждого отдельного случая отдельно прописываются соответствующие словоформы.
        • Сами словоформы конкретного шаблона при этом никак не зависят от других шаблонов, переменных параметров и прочего
        • Эти словоформы легко увидеть при просмотре исходников шаблона, и легко исправить при необходимости
        • Если будет необходимо получить набор словоформ слова с помощью бота, то с таким подходом сделать это будет довольно не сложно.
      • При этом я, конечно, ничего не имею против текущего же применяющегося подхода, когда все результирующие шаблоны зависят от некоторого (или некоторых) базовых, за счет чего не приходится дублировать многие моменты (кроме словоформ — их, как я написал выше, считаю что дублировать важно и целесообразно)
    3. С точки зрения автоматического использования шаблонов для создания списка словоформ (с помощью бота)
      • Можно выделить несколько разных идей и подходов для решения задачи автоматического получения словоформ для существующих слов:
        1. Автоматический анализ существующих шаблонов, загрузка вики-текстов существующих словарных статей и формирование списка словоформ на основании проделанного анализа шаблонов
          • Собственно это тот подход, который я уже начал реализовывать
          • Он почти полностью совместим с текущим подходом создания шаблонов
            • Исключение составляет несколько случаев, о которых писал выше (кое-где мелькает #if и включение шаблонов), но это происходит крайне редко и можно будет исправить вручную
          • Я очень рассчитываю на этот вариант
        2. Загрузка html-варианта словарных статей, и последующий парсинг с целью вычленения русских заголовков, далее описание параметров базовой формы (из текста получить конкретные значения) далее таблиц словоизменения, далее используемых строк в этой таблице для определения параметров словоформы, ...
          • Подход более тяжелый
            • и с точки зрения загрузки огромнейшего массива данных - веб-страниц
            • и с точки зрения парсинга html-текста (слишком много разнородных данных нужно идентифицировать)
            • плюс при этом мы сильно привязываемся к конкретным текстам при генерации вывода шаблонами и при малейших их изменениях алгоритм будет давать сбои
          • Это всё реализовать теоретически возможно, но в данном случае мне кажется, что "овчинка выделенки не стоит"
          • Реализация, если за нее браться, займет слишком много сил и времени (я не уверен, что займусь)
        3. Возможно есть какие-то автоматические подходы, которые позволяют довольно несложно запустить некоторый шаблон с определенными параметрами и получить его результат
          • Тогда даже со сложной организацией шаблонов можно было бы попробовать частично реализовать предыдущий тяжелый подход
          • При этом загружаем не html-страницы, а wiki-тексты и идентифицировать заголовки, описание и прочее не нужно, а только лишь столбцы результирующей таблицы, что гораздо проще
          • Однако не уверен, что есть такая удобная автоматическая возможность, но могу ошибаться
        4. Если Участник:DonRumata перепишет шаблоны словоизменения на Lua, то возможно появятся еще подходы
          • Однако это явно не произойдет в ближайшее время (слишком много труда по их написанию и по внедрению вместо существующих)
          • А также еще пока совсем не ясно, облегчит ли это задачу получения словоформ для слова с помощью бота

Приношу извинения за большой объем сообщения, но я попытался всесторонне взглянуть на ситуацию, разбил мысли по группам для облегчения восприятия и попробовал найти достаточную аргументацию для разных взглядов/подходов.
Если же кратко, то:

  • именовать шаблоны хотелось бы красиво, однотипно и понятно — (удобно для человека)
  • содержимое шаблонов должно содержать список всех словоформ, без усложнений — (удобно как для человека, так и для бота)

Очень прошу поддержать это обсуждение всеми заинтересованными лицами, а также в итоге принять некоторое решение по этому поводу. Очень не хочется откладывать эту задачу в долгий ящик, когда уже так много сделано --Vitalik7 (обсуждение) 23:35, 27 ноября 2013 (UTC)[ответить]

    • Считаю, что предложенный подход (лазить внутрь шаблонов и что-то из них извлекать) идейно неправильный. А правильный такой: каждый шаблон словоизменения должен содержать возможность порождать не табличку, а запрошенную словоформу либо информацию о слове. Что-то такое для каких-то шаблонов вроде бы уже делалось (деталей не помню -- тогда этим не интересовался). И тогда на долю скрипта останется чисто механическая работа:
      • выделить из статьи шаблон словоизменения со всеми параметрами;
      • вызвать его с дополнительным параметром "расскажи о слове";
      • если не рассказал -- отмечаем, что то ли с шаблоном, то ли со статьей что-то не в порядке (шаблон старый либо неправильно вызван);
      • если рассказал -- вызываем нужное число раз с дополнительным параметром "выдай такую-то форму";
      • если ответил, что формы нет или она предположительная -- игнорируем; если выдал форму -- складываем ее в базу данных;
      • в конце эту базу анализируем.
    • P. S. И вообще я бы не торопился. Должна быть огромная межъязыковая омонимия (столбы -> столб/ru, столбъ/ru-old; пишу -> писать/ru, писати/uk и т. п.), а в нерусских разделах еще конь не валялся. --M. G. J. (обсуждение) 03:51, 28 ноября 2013 (UTC)[ответить]
  • Идея очень красивая и интересная. Когда начинал писать это сообщение, хотел сказать что, я пока не нашел ни одного способа программного запуска шаблона с параметрами и получение его результата "на лету", а затем пришла такая мысль: а что если попробовать воспользоваться для этого страницей Служебная:Развёртка_шаблонов. Жаль, что подобный механизм, похоже, в библиотеку pywikibot включен не был и придется делать это самостоятельно. Но хоть так. Если же я ошибаюсь, то был бы признателен за любые указания на этот счет.
    Теперь по самому подходу. Один из недостатков такого подхода — это то, что для каждого слова придется многократно дергать сервер, а это некрасиво. Поэтому я (пока это возможно сделать сравнительно легко) попробую извлечь словоформы из текущего механизма шаблонов словоизменения, а в будущем, если мы все-таки пойдем по предложенному пути развития, тогда попробую подстроиться под эти новые веяния.
    Однако, решение касательно будущего развития шаблонов все равно еще не принято и его нужно сначала всесторонне обсудить. И все-таки что-то с этим сделать в итоге (я прямо настаиваю, т.к. это не одно только мое личное мнение). В текущем некотором небольшом хаосе (каждый делал шаблоны словоизменения как хотел и при этом менять как будто ничего нельзя ибо привыкли) — ничего хорошего нет! (это просто вопль негодования относительно сообщения ниже). --Vitalik7 (обсуждение) 11:06, 29 ноября 2013 (UTC)[ответить]
    • Гм.. Кстати, если в итоге будет одобрен именно такой путь развития, то очень кстати окажется идея DonRumata с написанием шаблонов словоизменения на Lua, ибо на обычном языке шаблонов это, мне кажется, будет слишком сложно и громоздко (писать, понимать, сопровождать) --Vitalik7 (обсуждение) 17:47, 29 ноября 2013 (UTC)[ответить]
  • А по поводу огромной межъязыковой омонимии я бы особо не переживал. Всегда будут оставаться какие-то непокрытые языки. Покрыть же их позже — не составит особого труда. Вот вам существующий пример: "души", в статье представлены словоформы от русского и болгарского, но еще нет, например, украинского. Добавить его можно либо без особых проблем вручную, либо с помощью бота, когда он научится получать словоформы на других языках. --Vitalik7 (обсуждение) 18:15, 29 ноября 2013 (UTC)[ответить]
  • Vitalik7, а какое отношение имеет удобство наших шаблонов для внешних парсеров к проекту? Как нам удобно так и будем делать. Наименования шаблонов устоялись, менять никто не будет. Латинские буквы в названиях русских шаблонов используются для унификации.
    • Именование шаблонов не имеет никакого отношения к внешним парсерам и работе бота. Я специально разбил свои тезисы на группы, чтобы это было ясно. Первая секция (внешнее представление) - это были лишь предложения (для удобства человека), которые высказывал не только я, но и другие участники на этой и соседних страницах. И еще очень досадно, что несмотря на мою попытку разложить все по полочкам, донести свою мысль — у меня, выходит, это сделать не получилось. Вы, почему-то восприняли всё это как будто "шаблоны необходимы для парсера" и ничего другого не увидели. Обидно. --Vitalik7 (обсуждение) 11:27, 28 ноября 2013 (UTC)[ответить]
  • M. G. J., давайте обсуждать насущные проблемы нашего проекта. Эта страница предназначена для обсуждения в рамках проекта Викимедиа. Don Rumata 06:28, 28 ноября 2013 (UTC)[ответить]

Закрыто. Для того чтобы парсить словарь, бот не нужен. Дальнейшее обсуждение о внесении омоформ ботом можно будет продолжить после создания базы этих омоформ, которой пока нет. Все комментарии инициатора обсуждения о закрытии темы перенесены на его СО.

Перенесено на страницу Обсуждение участника:Vitalik7

Don Rumata 23:16, 4 декабря 2013 (UTC)[ответить]

Пробная заливка[править]

Vitalik, а вы можете по вашей базе подготовить список омоформ, и какую оттуда информацию можно извлечь о словоформе (часть речи, число, падеж, род, лицо, время и т. д.)? Для начала можно было сделать пробную заливку, но не редиректов, а статей-дизамбигов. Глядишь, к полулимону подошли бы перед Новым годом.))--Cinemantique (обсуждение) 00:29, 28 ноября 2013 (UTC)[ответить]

Гм.. Когда я говорил, что много сделано, то не имел в виду, что работа близится к завершению.
Сделано действительно очень много. Во-первых, загрузка всех словарных статей и налаживание автоматического процесса его обновления - всё это заняло много вечеров, помимо крупной задачи приходилось решать ряд сопутствующих технических, хоть сравнительно небольших, но тем не менее требующих времени для решения, а со свободным временем сейчас как раз проблема. Во-вторых, немало времени потрачено на изучение шаблонов словоизменения и произведены первые попытки по анализу и загрузки их содержимого.
Однако, во-первых, продолжать эту работу имеет смысл только если утвердить предложенное решение по поводу хранения словоформ в шаблонах (по сути просто утвердить уже применяемый сейчас повсеместно подход, подогнать немногие отличающиеся шаблоны под этот стандарт, исправить мелкие различия в оформлении шаблонов, связанные с человеческим фактором). Во-вторых, даже в этом случае работа по анализу шаблонов остается весьма значительной, но тут, помимо самого подхода анализа, загрузки и использования (который также нужно еще написать), остаются уже просто более рутинные моменты (надо выделять общие и интересующие нас моменты в шаблонах словоизменений, а также находить соответствия между параметрами в шаблонах словоизменений и параметрами в шаблонах описания словоформ для каждой части речи).
Т.е. всё вполне реально, но работы еще много и требуется время на ее выполнение. Когда будет закончена часть работы, связанная с анализом и разбором шаблонов, можно будет получить список омоформ и извлекать любую информацию о словоформе.
Кстати, забегая немного вперед, у меня небольшой вопрос: считать ли такими "дизамбигами" варианты, когда одно и то же слово одинаково пишется, например, в разных падежах, числах и т.п.? --Vitalik7 (обсуждение) 01:10, 28 ноября 2013 (UTC)[ответить]
У нас нет статей неоднозначностей. Это не Википедия. Каждая статья в основном пространстве должна быть посвящена слову. Слова́рь — справочная книга, которая содержит слова (или морфемы, слово­со­че­та­ния, идиомы и т. п.), располо­жен­ные в опреде­лён­ном порядке (различ­ном в разных типах словарей), объясняет значения описываемых единиц, дает различную информацию о них или их перевод на другой язык либо сообщает сведения о предметах, обозначаемых ими. Don Rumata 06:38, 28 ноября 2013 (UTC)[ответить]
У нас нет статей неоднозначностей. Вы ошибаетесь, Румата: классический пример домну, вариации: маня, воронье, иглу. --Infovarius (обсуждение) 10:05, 28 ноября 2013 (UTC)[ответить]
Сравни Служебная:DisambiguationPages и w:Служебная:DisambiguationPages. Don Rumata 11:44, 28 ноября 2013 (UTC)[ответить]
Это техническая вещь. Можно и добавить специальные шаблоны в такие "статьи", если в этом смысл появится. --Infovarius (обсуждение) 17:46, 28 ноября 2013 (UTC)[ответить]
  • Ни каких пробных заливок ботами! Буду банить беспощадно. Речь шла только о создании перенаправлений. Все крупные заливки только после публичного голосования и при безусловной поддержке большинства участников проекта! Don Rumata 06:49, 28 ноября 2013 (UTC)[ответить]
    • Я думал, что на странице участника можно создавать любые страницы, они ведь никак не влияют на основное пространство. Вы же не могли подумать, что бот будет делать существенные правки в основном пространстве, не будучи опробованным в личном пространстве? Я уже не новичок и песочницей пользоваться умею, и мой бот вроде пока не давал повода в нем усомниться, работал только на моих страницах участника. --Vitalik7 (обсуждение) 08:50, 28 ноября 2013 (UTC)[ответить]
      Я не понимаю, мы говорим о создании редиректов или о чём? Какие личные страницы? Вы о создании статей для омоформ типа домну? Какой тут бот? Во-первых, формы слов могут совпадать с лемматизированными формами. Во-вторых, есть слова на других языках. Это не тупая заливка статей. Don Rumata 11:44, 28 ноября 2013 (UTC)[ответить]
      >> Я не понимаю, мы говорим о создании редиректов или о чём? Какие личные страницы? Вы о создании статей для омоформ типа домну?
      Изначально (в предыдущей секции обсуждения) речь шла о редиректах, т.к. их создать проще, и как правильно заметил Участник:Vesailok при необходимости они очень легко потом превращаются в словарные статьи (благодаря тому, что соответствующий шаблон словоформы там уже будет). Однако в этой секции Участник:Cinemantique предложил создать список омоформ (можете называть это как угодно: омоформы, омонимы, неоднозначности, дизамбиги, слова, представленные на разных языках или в разных формах и прочее, суть сообщения от этого не меняется, ведь имелся в виду тот подход, который сейчас используется в ВС). И да, Участник:Infovarius привел выше хороший пример, это словарные статьи типа "домну". Обратите внимание, в первую очередь было предложено создать просто список омоформ (в самом начале сообщения). Далее было предложено показать, какая информация о параметрах словоформы и базового слова может быть извлечена на основании шаблонов для слов из этого списка. После этого было предложено сделать пробную заливку. Естественно, что эта пробная заливка должна сначала опробоваться для какой-нибудь одной омоформы в личной песочнице (пока всё не заработает должным образом), затем можно прогнать-проверить работу алгоритма на всех омоформах, можно для начала это сделать в личном пространстве (т.е. на под-страницах от Участник:Vitalik7, т.е. на страницах в этом пространстве), а уж потом после того, как все будет работать идеально и будет одобрено сообществом — применять массово для основного пространства.
      >> Какой тут бот? Во-первых, формы слов могут совпадать с лемматизированными формами. Во-вторых, есть слова на других языках. Это не тупая заливка статей.
      Возможно у вас превратное мнение о возможностях ботов. Это могут быть не обязательно какие-нибудь простые рутинные операции. По сути любую задачу, которую можно описать формально — можно поручить боту. Он может быть довольно умным, если его должным образом написать. И это очень сильно облегчит человеческий труд, избавит от рутинных задач и позволит сконцентрироваться на более творческих задачах (а работы в ВС просто непочатый край). Могу ответственно заявить, что если решить задачу по извлечению словоформ для слов (с определением их параметров), то сделать и редиректы, и отдельные статьи типа "домну" будет одинаково легко. При этом наличие словарной статьи в ВС (лемматизированная форма или слово на другом языке) может быть останавливающим фактором и такие варианты на первом этапе просто не будут рассматриваться и формироваться в списке. Но на самом деле даже добавление словоформ в существующие статьи, уже содержащие слова или словоформы на других языках, — не будет сильной помехой в этом деле (однако, я об этом не думал пока даже и не упоминать, учитывая ваш страх перед деятельностью ботов, всему свое время, если позволит сообщество).
      Работа бота ≠ тупая заливка статей! Наоборот — очень досадно видеть, что многую рутинную работу сейчас приходится делать вручную, и еще более досадно, что находятся люди, которые не хотят это менять. Странное решение, в век информационных технологий для информационного проекта не использовать возможности автоматизации на полную катушку. --Vitalik7 (обсуждение) 18:39, 28 ноября 2013 (UTC)[ответить]
      У меня нет никакой боязни ботов. Я сам программист. Просто я знаю как бывает, когда приходит участник не знакомый с реалиями проекта. Создайте для начала список омоформ на одной странице. Просто добавьте в столбик цепочки (омоформа → лемматизированная форма + падеж → вторая лемматизированная форма + падеж). Я проверю существуют ли для них страницы в словаре, и какие проблемы могут возникнуть при их добавлении в существующие статьи. Don Rumata 00:02, 29 ноября 2013 (UTC)[ответить]
      Отлично! Я очень рад, что вы не возражаете, против попытки реализации этого подхода. Я согласен, что пока новичок в проекте и должен вести себя крайне осторожно и аккуратно. Перед тем как мы сможем получить список омоформ с характеристиками - нужно еще проделать много кропотливой работы по анализу шаблонов, извлечению словоформ и т.п., а также собственно всё это реализовать. Следующим этапом будет генерирование соответствующих шаблонов-словоформ и редиректов, а потом, если все красиво и качественно получится, то даже и статьи для омоформ. Но, конечно, все это будет применено только если будет правильно реализовано, проверено и одобрено сообществом. --Vitalik7 (обсуждение) 01:04, 29 ноября 2013 (UTC)[ответить]
Думаю, что если создать редиректы на словарную статью тех русских словоформ, которые в принципе существуют в других языках, но пока что не имеют отдельных статей, то впоследствии их можно будет исправить без особых проблем. --- Vesailok 16:52, 28 ноября 2013 (UTC)[ответить]

Глагольный шаблон[править]

Как включить в шаблон с непереходным глаголом страдательное причастие настоящее времени (здесь)?--Cinemantique (обсуждение) 14:38, 13 ноября 2013 (UTC)[ответить]

Вы о слове благодетельствуемый или благодетельствованный? Разве такие есть? — soshial@ 19:27, 13 ноября 2013 (UTC)[ответить]
благодетельствуемый имеется, согласно словарю Зализняка.--Cinemantique (обсуждение) 02:50, 14 ноября 2013 (UTC)[ответить]
Хороший вопрос, чёрт возьми! Спасибо. — soshial@ 06:01, 14 ноября 2013 (UTC)[ответить]
Нет благодетельствованный, есть облагодетельствованный от гл. облагодетельствовать. Don Rumata 11:03, 15 ноября 2013 (UTC)[ответить]
◆ Я слишком благодетельствован моим государем, чтобы осмелиться в чем-либо ему не усердствовать. А. С. Грибоедов ◆ Не меньше рыдали и благодетельствованные ею; с сожалением вспоминали знавшие ее... Квитка-Основьяненко ◆ Благодетелю от благодетельствованного. Д. В. Давыдов ◆ На все вопросы Ермолова, курьер, который был родом турок, долго хранил упорное молчание; он был окрещен и благодетельствован дядею отца Ермолова. Д. В. Давыдов ◆ ...и был он от покойного моего батюшки всегда благодетельствован... граф А. Р. Воронцов -- M. G. J. (обсуждение) 11:52, 17 ноября 2013 (UTC)[ответить]
Полагаю, следует считать это ошибкой и дать указание: «Встречается нелитературная форма…», плюс редирект. Или опять делать статью… Так на все ошибки замучаемся статьи делать.--Cinemantique (обсуждение) 13:03, 17 ноября 2013 (UTC)[ответить]
Нельзя считать ошибкой. Это устаревшая форма, а не просто нелитературная: некогда глагол употреблялся как переходный (см., например, "Словарь рус. яз. XVIII в.", вып. 2). -- M. G. J. (обсуждение) 14:44, 17 ноября 2013 (UTC)[ответить]
Значит, указать как устаревшую тем же способом (но со статьёй, а не редиректом). В русском языке слишком много устаревших и диалектных вариантов, чтобы перегружать ими таблицу форм.--Cinemantique (обсуждение) 14:54, 17 ноября 2013 (UTC)[ответить]
Кто сказал "редирект"? Я за то, чтобы никакие причастия не были редиректами к глаголу. А в таблице или в примечании к ней — не столь существенно. -- M. G. J. (обсуждение) 14:59, 17 ноября 2013 (UTC)[ответить]
В Викисловаре причастия считаются отдельной частью речи и описываются в статьях. Устаревшая форма использовалась в дореформенной орфографии благодѣтельствованный. В современном русском языке глагол благодетельствовать непереходный. Don Rumata 08:02, 18 ноября 2013 (UTC)[ответить]
Всё так, но и что отсюда следует?
  • Что для причастий пишутся отдельные статьи -- никто не спорит и не спорил.
  • Вопрос в том, надо ли на них в данном особом случае сослаться из статьи про глагол. И если надо -- то где и в какой форме. Можно в таблице (м. б. придется поправить шаблон спряжения, чтобы при нужде в нем порождались и формально запрещенные причастия), а можно из комментария ("существуют также устар. формы страд. прич. наст. вр. благодетельствуемый и прош. вр. благодетельствованный"). Я за комментарий, если что. Тем более что именно так в статьях про непереходные глаголы руководить и управлять упомянуты страдательные причастия руководимый и управляемый.
  • Орфография же вообще упомянута не по делу. Любую форму любого слова можно из старой орфографии перевести в новую и наоборот. Не бывает такого, чтобы по одной орфографии слово существовало, а по другой -- нет.
--M. G. J. (обсуждение) 09:25, 18 ноября 2013 (UTC)[ответить]
В Викисловаре дореформенная орфография описывается в отдельных статьях и разделах. См. Русский язык (дореформенная орфография). Есть Шаблоны словоизменений/ru-old. Если у вас есть желание, то вы можете заняться созданием шаблонов спряжений глаголов для таких слов. Don Rumata 10:59, 18 ноября 2013 (UTC)[ответить]
При чем тут орфография? Как в дореформенной благодѣтельствованный было причастием от благодѣтельствовать, так и в нынешней благодетельствованный есть причастие от благодетельствовать. А на транслите blagodetel'stvovannyj есть причастие от blagodetel'stvovat'. Хоть иероглифами пиши, хоть значками IPA, всё то же самое будет. Это запись одних и тех же слов разными средствами. Они в любой записи существуют и соотносятся одинаково. -- M. G. J. (обсуждение) 11:18, 18 ноября 2013 (UTC)[ответить]
Нет причастия благодетельствованный в современном русском языке, т.к. глагол благодетельствовать непереходный. Вас даже Гугл поправит, если вы такую форму искать будете. Don Rumata 21:18, 18 ноября 2013 (UTC)[ответить]
На каком языке написаны приведенные ниже фрагменты и какой частью речи является выделенное в них слово, а? ◆ Многим мы бывали благодетельствованы царями российскими. Е. Федоров, «Уральские повести», 1941 г. ◆ Земли, которые занимают убыхи, чепсоны (одно из племен шапсугов) и гусие, благодетельствованы природой, потому что они дают человеку самые разнообразные фрукты, не требуя от людей особых затрат труда. И. Ф. Бларамберг, «Историческое, топографическое, статистическое, этнографическое и военное описание Кавказа» / перевод А. И. Петрова с франц. оригинала 1836 г., 1974 г. // «Адыги, балкарцы и карачаевцы в известиях европейских авторов XIII—XIX вв.» ◆ Достаточно указать на А. П. Сумарокова; по его словам, Петр «старинны грубости искоренял», за что люди, им благодетельствованные, должны были его назвать богом. Л. Н. Пушкарев, «Общественно-политическая мысль России: вторая половина XVII века», 1982 г. ◆ Однако вскоре юношу поманили эполеты, и, будучи благодетельствован некоею «особой», был он зачислен корнетом в Лубенский гусарский полк. М. А. Турьян, «Странная моя судьба (о жизни В. Ф. Одоевского)», 1991 г.
В общем, есть некоторое количество непереходных глаголов, от которых таки образуются страдательные причастия (жирные — явно указаны Зализняком в описаниях соотв. глаголов, прочие взяты из разных трудов по лингвистике): достигнутьдостигнутый, избегнутьизбегнутый, командоватькомандуемый, подёрнутьподёрнутый, предшествоватьпредшествуемый, пренебрегатьпренебрегаемый, пренебречьпренебрежённый, руководитьруководимый, сопутствоватьсопутствуемый, угрожатьугрожаемый, управлятьуправляемый... Тут тот же самый случай, только еще и устар.. --M. G. J. (обсуждение) 09:10, 19 ноября 2013 (UTC)[ответить]

┌───────────────────────────────────────┘
Коллега, из всех ваших цитат более-менее подходит только первая, но смысл её у меня ускользает. Тут должно быть либо многим мы бывали благодетельствуемы царями, либо многим мы бывали облагодетельствованы царями. Это какой-то авторский окказионализм. Во всех остальных цитатах причастие употребляется явно в совершенном виде. У гл. несов. вида благодетельствовать — «делать благо, благотворить» есть видовая пара гл. сов. вида облагодетельствовать — «сделать благо» и соответственно страд. причастие сов. вида. И то и другое в словарях помечено как устаревшее. По-любому, этот спор может разрешить только указание на авторитетный лингвистический источник. Приведу цитату:

В страдательных причастиях давно уже нарушен параллелизм между формами настоящего и прошедшего времени. А. А. Потебня так охарактеризовал этот процесс: «На свойственной нынешнему языку степени развития категорий совершенности и несовершенности глаголы совершенные не имеют причастия настоящего страдательного (равно как и действительного), вследствие чего мысль языка начинает роднить самое понятие о причастии прошедшем страдательном с совершенностью. Поэтому-то и, наоборот, причастие прошедшее страдательное от глаголов несовершенных более длительных как бы начинает выходить из употребления, по крайней мере в отдельных случаях; можно сказать: был укоряем, упрекаем, обвиняем, распространяем... сберегаем; было приобщаемо, сообщаемо к сведению, но нельзя сказать: был укорян, упрекан, было приобщано» (130).

В современном языке причастия на -нный и -тый от основ несовершенного вида непродуктивны. Живые формы таких причастий немногочисленны: читанный, писанный, надеванный, несенный, тертый, петый и т. п. Основы несовершенного вида на -а, соотносительные с беспредложными основами вида совершенного на -и, не могут образовать такого причастия (ср. невозможность форм вроде: бросанный, покупаемый и т. п., но: брошенный, купленный и т. п.) (131).

В.В. Виноградов «Русский язык»

Честно говоря я не очень понимаю зачем об этом спорить. Don Rumata 12:11, 19 ноября 2013 (UTC)[ответить]

Вот решение:
Благоде́тельствовать, с т в у ю, с т в у е ш ь, несов., неперех. и перех.
1. Неперех. Оказывать пользу, услуги, покровительство. <...>
2. Перех. устар. Приносить пользу, награждать, одарять чем.

— БАС, т. 1 (1950), стлб. 481.

А -- M. G. J. (обсуждение) 13:04, 19 ноября 2013 (UTC)[ответить]

Моя точка зрения такова, что раз уж мы описываем язык не только какой он в данный момент, но и какой он был хотя бы двести лет назад (а иначе зачем нам пометы "устар." и "старин."), нужно добавлять устаревшее переходное значение глагола с соответствующими пометами и тогда не будет вопросов как это всё оформлять: всё будет находиться в таблице. Что делать в случаях, когда страдательное причастие вдруг появилось при том, что глагол никогда не был переходным, — не знаю. Возможно, в таких случаях слова можно указать в параметре |коммент=... в шаблону глагола. — soshial@ 13:08, 19 ноября 2013 (UTC)[ответить]

Я не против, указывайте в примечаниях параметром коммент= устаревшие формы. Только не нужно их добавлять в таблицу. Don Rumata 13:54, 19 ноября 2013 (UTC)[ответить]

Категория прилагательных[править]

Заметил, что создаваемые через скрипт статьи о русских прилагательных не включаются в категорию «Русские прилагательные» (байдарный, например).--Cinemantique (обсуждение) 17:10, 12 ноября 2013 (UTC)[ответить]

Всё дело в том, что {{прил ru 1a}} не помещал в эту категорию. А вы за то, чтобы помещать в родительскую, при том, что статья уже находится в Прилагательные, склонение 1a? Infovarius (обсуждение) 05:51, 13 ноября 2013 (UTC)[ответить]
Наверное, за. Для чего-нибудь может пригодиться, не знаю. Меня больше беспокоит нахождение словоформ в общей языковой категории, из-за чего нельзя точно сказать, сколько у нас словарных единиц (и провести сравнение с обычными словарями).--Cinemantique (обсуждение) 07:37, 13 ноября 2013 (UTC)[ответить]
Именно поэтому я не люблю систему категорий в en- и fr-словарях :) Там я до сих пор не могу правильно определить число слов в каждом языке. У нас это хоть возможно, т.к. все слова дублируются в головных категориях типа Русский язык. --Infovarius (обсуждение) 14:07, 13 ноября 2013 (UTC)[ответить]

Подпись[править]

Если кого-то очень сильно беспокоит "подпись", нельзя ли включить соответствующий "тег" для автоматической подстановки подписи не только в истории правок, но и при закрытии окна с записью или комментарием в обсуждениях, или -- добавить цветное разделение записей от различных участников? Такие возможности вики-медией предусмотрены.

Полный формат[править]

Можно ли в заготовку для статей установить полный формат заготовки для морфологии?

{{морфо|прист1=|прист2=|суфф-1=|прист3=|корень1=|суфф-1=|суфф-2=|соед=|прист21=|корень2=|суфф1=|суфф2=|оконч=|частица=}}

Редактирую[править]

Коллеги, напомните, пожалуйста. У нас есть шаблон "редактирую", который просит временно не вмешиваться в работу над статьёй? -- Andrew Krizhanovsky (обсуждение) 09:04, 11 ноября 2013 (UTC)[ответить]

Есть, и даже не один, кажется. Точно есть {{занято}} и {{Пишу}}, было что-то еще, но практически это не используется. --Al Silonov (обсуждение) 10:08, 11 ноября 2013 (UTC)[ответить]
Спасибо большое! Если в течение ближайшего месяца будут появляться словарные статьи с таким шаблоном, то это мои студенты изучают возможности Викисловаря, см. vk точка com/pages?oid=-41102811&p=%D0%92%D0%B8%D0%BA%D0%B8%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C :) -- Andrew Krizhanovsky (обсуждение) 13:00, 11 ноября 2013 (UTC)[ответить]
Было бы здорово увидеть эти мастер-классы на Ютубе.--Cinemantique (обсуждение) 13:20, 11 ноября 2013 (UTC)[ответить]
Учту на будущее. Сомневаюсь, что будет красивая картинка, но должно быть познавательно. -- Andrew Krizhanovsky (обсуждение) 18:38, 11 ноября 2013 (UTC)[ответить]
Крутая идея своих студентов к подобному приучать! — soshial@ 14:16, 11 ноября 2013 (UTC)[ответить]

Произношение[править]

Такое аудиовизуальное приложение, как в статье сто, во многих браузерах и компьютерах не работает, а мы претендуем на универсальность для любого желающего воспользоваться словарём. Ранние варианты -- со ссылкой на файл, были более работоспособными.

  • В Opera и Firefox работает, например. Где не работает?--Cinemantique (обсуждение) 17:26, 5 ноября 2013 (UTC)[ответить]
    • IE
      • У меня в IE 10 при щелчке по той области предложило загрузить и открыть ogg-файл. --Vitalik7 (обсуждение) 22:31, 5 ноября 2013 (UTC)[ответить]
        • Я вижу безобразную чёрную полосу с невписывающимся по размеру, серым -- возможно треугольником, внутри: при нажатии, требует установить Джаву. Однако, по поводу Джавы есть постоянные предупреждения о возможности внедрения в комп вредоносных программ и шпионажа.
Честно говоря, после внесения этого инструмента внутрь шаблона МФА стало довольно уродливо, и даже работающий вариант (у меня FireFox) неудобен. Субъективно: раньше, с обычным {{медиа}} было лучше. --Al Silonov (обсуждение) 08:03, 6 ноября 2013 (UTC)[ответить]
У меня через шаблон «медиа» файл проигрывается в новом окне (или, если кликать по картинке, открывается страница на Складе), приходится возвращаться в статью, нажимая кнопку «Назад». Трудно назвать это удобным функционированием.--Cinemantique (обсуждение) 09:43, 11 ноября 2013 (UTC)[ответить]

Предложения по спискам значков в нижнем меню[править]

Спецсимволы (основной набор): добавить кавычки « » „ “ и по отдельности.

IPA for Russian: сделать одинаковое двоеточие у ʑ: и ɕː (и ботом перепроверить в статьях).

Кириллица: добавить ударение само по себе (и заодно уж и побочное ударение: ра̀диопереда́ча, еще два ударения для сербского и знак долготы) и ять-фиту-ижицу.

Старославянские буквы: убрать "ѹ/Ѹ" (в уникоде они давно объявлены нежелательными и подлежащими замене на о/О + у; надо бы ботом и из статей вычистить) и "Ҁ" (это вообще не буква и вряд ли где потребуется вне статьи про саму себя). Добавить строчные буквы.

Слав. латиница: добавить югославские надстрочники для гласных (четыре вида ударения и знак долготы). -- M. G. J. (обсуждение) 20:26, 31 октября 2013 (UTC)[ответить]

Оглавление[править]

Сейчас в настройках можно ставить птичку на условие "Показывать оглавление (для страниц более чем с 3 заголовками)". Но для словаря это фактически бесполезная опция: даже у самой что ни на есть болванки уже имеется структура с десятком заголовков. Более осмысленный вариант (для основного пространства статей) был бы такой: если на странице есть минимум два заголовка первого уровня (т. е. несколько языков) или минимум два заголовка второго уровня (т. е. есть омонимы), то показывать оглавление с первыми двумя уровнями заголовков, а в противном случае не показывать ничего. -- M. G. J. (обсуждение) 06:39, 31 октября 2013 (UTC)[ответить]

Шаблон lang[править]

Появилось несколько вопросов-задач по поводу шаблона {{lang}}. Прошу ознакомиться и высказать мнение.

  1. Для языков с некириллической и нелатинской графикой предлагаю ввести рекомендацию указывать транскрипцию на латинице. Для большинства пользователей иероглифы, арабская вязь и прочее — это абсолютно нечитабельные и с трудом воспринимаемые закорючки. В русских источниках такая традиция вроде бы есть. Надо бы только определиться с используемыми стандартами для разных график. Я думаю, будет правильным располагать эту транскрипцию непосредственно после оригинального написания, а для этого необходимо включить в шаблон дополнительный параметр комментария.
  2. Есть ещё такая традиция: при разложении исходника на составные части не дублировать название языка, если он совпадает с уже указанным. Например,
франц. bœuf braisé < bœuf «говядина» + braiser «жарить на слабом огне».

а не

 франц. bœuf braisé < франц. bœuf «говядина» + франц. braiser «жарить на слабом огне».

Соблюсти этот принцип, используя шаблон во второй части, невозможно. Приходится не использовать его, но в этом случае шрифтовое оформление слов различается, и это не очень красиво.

  1. И последний вопрос разъясню на примере bœuf braisé. Есть некоторые сомнения, что это устойчивое сочетание во французском и, следовательно, о нём может быть создана статья. В подобных случаях хотелось бы отключить простановку вики-ссылки.--Cinemantique (обсуждение) 14:09, 30 октября 2013 (UTC)[ответить]
  • А почему латинскими буквами (которых всего-то 28), а не русскими, и -- как быть с теми звуками, которых нет ни в латинской и не в русской азбуке: горловое К (Қ с хвостиком), горловое Г (как в белорусском - Ґ, малороссийском, украинском... диалектическом), О с пояском (Ө - йёо), носовые звуки и буквы (как Ң), хрипящие, шипящие, придыхательные, буквы Ə, Ў, Ұ и т.д.?

Шаблоны морфемики[править]

См. изъять, выплакать. В морфологии окончания названы суффиксами. Weldis (обсуждение) 16:25, 21 октября 2013 (UTC)[ответить]

Кто-то что-то подправил без консенсуса. "-ть" может рассматриваться и как суффикс в инфинитиве, и как окончание. Надо срочно определяться, что это в нашем словаре. --- Vesailok 17:21, 21 октября 2013 (UTC)[ответить]
Для начала нужно срочно восстановить, как было.Weldis (обсуждение) 18:17, 21 октября 2013 (UTC)[ответить]
Кстати, в благодарить всё осталось по-прежнему. Weldis (обсуждение) 18:25, 21 октября 2013 (UTC)[ответить]
Weldis, пожалуйста, придумывай более содержательные, предметные заголовки в обсуждениях. "Караул" у нас везде, надо конкретнее. --Al Silonov (обсуждение) 20:17, 21 октября 2013 (UTC)[ответить]

Гипонимы и гиперонимы[править]

Построил список гипонимов и гиперонимов по данным Русского Викисловаря по дампу от 2013-08-15. https://docs.google.com/file/d/0B5yjAmdZqsqNa0RMWG11LVg0cjg/edit?usp=sharing

Всего пар гипонимов и гиперонимов для существительных: 42108. -- Andrew Krizhanovsky (обсуждение) 21:52, 18 октября 2013 (UTC)[ответить]

Шаблон словоизменения с квадратными скобками в названии[править]

Пытаюсь создать шаблон склонения по схеме {{сущ_ru_n_ina_6*a((2))}} для слова верховье (см. starling и Зализняка), однако возникают проблемы с категориями. Просьба помочь. — soshial@ 15:24, 4 октября 2013 (UTC)[ответить]

Хм, интересно. Похоже, такие категории нельзя создавать. Можно по аналогии с шаблоном две пары круглых поставить. --Infovarius (обсуждение) 17:41, 4 октября 2013 (UTC)[ответить]

Род аббревиатур[править]

Коллеги, предлагаю добавить параметр «род» в шаблон {{abbrev}} для отображения в статьях и автоматической категоризации. Есть ли возражения и кто может взяться за реализацию?--Cinemantique (обсуждение) 12:57, 8 сентября 2013 (UTC)[ответить]

(И кстати, вызывает некоторые сомнения необходимость деления на слоги (то есть для переноса) аббревиатур…)--Cinemantique (обсуждение) 13:02, 8 сентября 2013 (UTC)[ответить]

Аббревиатура это не только США, КПСС, КА, но и Минобразования, соцкульбыт, военкомат, замглавы и пр. Слоги это не перенос. Don Rumata 22:02, 8 сентября 2013 (UTC)[ответить]
Думаю, род для аббревиатур не помешает. У АБЫРВАЛГ- род муской, а у ГЛАВРЫБА- род женский. Weldis (обсуждение) 07:21, 9 сентября 2013 (UTC)[ответить]

Управление списком наблюдения[править]

Ныне мой список наблюдения содержит 2000 страниц и стало очень трудно им управлять (конечно, подобное число, наверно, не сопоставимо с вашими). Кто-нибудь из вас знает какой-нибудь удобный способ персональной категоризации списка? Не обязательно как модуль mediawiki, можно и в виде javascript'а. Также, было бы очень удобно просматривать изменения по каждому списку отдельно. Спасибо. — soshial@ 20:45, 3 сентября 2013 (UTC)[ответить]

Не знаю такого способа. У меня пока 7323 страницы, но это никак не напрягает, т.к. в один день изменений очень мало, а все и не смотрю. Don Rumata 06:59, 4 сентября 2013 (UTC)[ответить]
Более 24 тысяч, полёт нормальный :) Немного тормозит при загрузке, но работать можно, успеваю все просматривать. "Расширенный список наблюдения" и "Управление списком наблюдения" в настройках/гаджетах включены? --Infovarius (обсуждение) 07:40, 4 сентября 2013 (UTC)[ответить]
"Расширенный список наблюдения" есть, а вот "Управление списком наблюдения" - это под секцией Специальные страницы? Дело не в том, что я не успеваю их проверять, а в том, что хотелось бы иметь несколько списков для различны целей. Ладно, буду пытаться искать что-либо.

Второй вопрос: как сделать так, чтобы вывелись страницы из списка наблюдения, которые ещё ни разу не были патрулированы. И просьба: обновить до последней версии гаджет "Быстрый предпросмотр с помощью Ajax", потому что не работает клавиша "Изменения". — soshial@ 12:00, 4 сентября 2013 (UTC)[ответить]

Ну если вы хотите различные списки наблюдения, можно сделать так: собрать отдельные списки на отдельные свои подстраницы, и смотреть на "Связанные правки" для каждой (в панели инструментов слева). Непатрулированные из списка наблюдения вроде нельзя получить, а устаревшие - через Special:PendingChanges. --Infovarius (обсуждение) 12:26, 4 сентября 2013 (UTC)[ответить]

Уточнение морфологии[править]

У слова белеть необходимо уточнить, что «соответствующий глагол совершенного вида» существует только для первого значения. Как это правильно сделать?--Cinemantique (обсуждение) 15:03, 31 августа 2013 (UTC)[ответить]

Вот так. Don Rumata 20:06, 31 августа 2013 (UTC)[ответить]

Столбцы[править]

Прошу участников, владеющих языком шаблонов, добавить параметр столбцы в шаблон {{книга}}, как это уже было сделано в ВП.--Cinemantique (обсуждение) 09:40, 29 августа 2013 (UTC)[ответить]

Чуть позже. Я его переписываю на Lua. 20:07, 31 августа 2013 (UTC)

Пометы в толкованиях[править]

Собрал некоторую статистику по условным сокращениям: Участник:AKA MBG/Статистика:Пометы.

Надеюсь, что в особенности третья табличка ("Labels found by parser") поможет улучшить статьи. Заодно можно обсудить вопрос - стоит ли писать очень длинные пояснения в шаблоне {{помета}}?
P.S. Чтобы отсортировать пометы по длине - кликните на заголовок столбца "Length". -- Andrew Krizhanovsky (обсуждение) 16:09, 20 августа 2013 (UTC)[ответить]

P.P.S. Наконец получилось извлечь региональные пометы (а именно: параметр шаблона {{рег.}}), см. таблицу Regional_labels, строки с категорией "regional automatic". -- Andrew Krizhanovsky (обсуждение) 10:12, 16 января 2014 (UTC)[ответить]

Пометы в переводах (правила оформления)[править]

Сейчас в правилах звучит:

В скобках после слов могут указываться стилевые пометы, например (устар.), ...

Предлагаю изменения (использование шаблонов) в формулировке правил:

Начало формулировки


В скобках после слов могут указываться стилевые пометы, например так:

{{перев-блок|предмет одежды|
|en=[[belt]], [[girdle]] ({{портн.|-}}), [[sash]] ({{комп.|-}}, {{помета|элемент одежды хакера}})
}}

Что будет выглядеть следующим образом:

предмет одежды

Конец формулировки

Тогда будет единое оформление помет в толкованиях, синонимах и переводах.
P.S. Не нравятся мне лишние круглые скобки, но без них не знаю как обойтись: у одного перевода может быть несколько помет (см. "sash" в примере). -- Andrew Krizhanovsky (обсуждение) 13:00, 22 августа 2013 (UTC)[ответить]

Ох, боюсь я с такими нововведениями никогда не сделаю удобный ввод переводов как у англичан. Don Rumata 16:54, 22 августа 2013 (UTC)[ответить]
Может, в переводах без шаблонов пометы указывать? Или через единственный {{помета}}. --Infovarius (обсуждение) 12:09, 23 августа 2013 (UTC)[ответить]
У англичан при добавлении перевода (если раскрыть доп. опции по кнопке "More") есть поле ввода "Qualifier" - это как раз наши условные сокращения. -- Andrew Krizhanovsky (обсуждение) 12:39, 23 августа 2013 (UTC)[ответить]

Запятая в начале пометы/пояснения[править]

Написал вопрос там: Запятая в начале пометы/пояснения. -- Andrew Krizhanovsky (обсуждение) 09:38, 9 января 2014 (UTC)[ответить]

Порядок сортировки в категориях[править]

Господа, по результатам обсуждения в Википедии w:Википедия:Форум/Технический#Сортировка «Ё»: к походу на багзиллу создан запрос bugzilla:52997 на изменение порядка сортировки согласно правилам русского языка. Прошу вас поддержать указанную инициативу. Don Rumata 05:36, 19 августа 2013 (UTC)[ответить]

"Поддержать" - это написать что-то в поле "Additional Comments" или есть какая-то кнопочка для голосования? -- Andrew Krizhanovsky (обсуждение) 11:48, 19 августа 2013 (UTC)[ответить]
Есть — Importance: Normal enhancement with 4 votes (vote)↙. Требуется регистрация.--Cinemantique (обсуждение) 12:35, 19 августа 2013 (UTC)[ответить]
Там дискутируют программисты, я, к сожалению, их языком не владею. Никто кратко и внятно, в человеческих терминах, не описал существующую ситуацию и предлагаемые варианты. Я не понимаю, что такое "проголосовать внесение в InitialiseSettings.php кода 'ruwiki' => 'uca-ru',". Значит, и поддержать не решусь. --Al Silonov (обсуждение) 12:58, 19 августа 2013 (UTC)[ответить]
Как выяснилось из недавнего обсуждения на багзилле, в Википедии был одобрен вариант с «Е» и «Ё» вперемежку. Нужно ли это нам? Don Rumata 14:53, 1 сентября 2013 (UTC)[ответить]
Так на голосовании по ссылке ведь проголосовали за разделение Е от Ё, и за то, чтобы Ё после Е было, разве нет? — soshial@ 14:59, 1 сентября 2013 (UTC)[ответить]
Ну вот выяснилось, что в алгоритме сортировки uca-ru «Ё» = «Е» и для неё не создаётся отдельной секции. Кстати, действительно, в академических словарях, например в БАС, слова с "Ё" указаны вперемежку и отдельного выделения слов, начинающихся на «Ё», нет. Don Rumata 15:19, 1 сентября 2013 (UTC)[ответить]
нет, такого нам не надо. Кстати, в крайнем случае - . --Infovarius (обсуждение) 19:17, 1 сентября 2013 (UTC)[ответить]

Фильтр № 3[править]

Хотел на странице «в отличии от» поставить шаблон wrongname вместо перенаправления, однако фильтр не позволяет. Предлагаю подкорректировать его.--Cinemantique (обсуждение) 08:47, 5 августа 2013 (UTC)[ответить]

Оформление Индекса, составляемого вручную[править]

Дополнительная информация[править]

Пример использования шаблона "кол" из википедии

Список, автоматически разбитый на три колонки:

  • Элемент списка 1
  • Элемент списка 2
  • Элемент списка 3
  • Элемент списка 4
  • Элемент списка 5
  • Элемент списка 6
  • Элемент списка 7
  • Элемент списка 8
  • Элемент списка 9
  • Элемент списка 10
  • Элемент списка 11
  • Элемент списка 12
  • Элемент списка 13
  • Элемент списка 14
  • Элемент списка 15
  • Элемент списка 16
  • Элемент списка 17
  • Элемент списка 18
  • Элемент списка 19


Предположительно требуемый фрагмент css
ol.index, div.index ol {
    margin: 0.2em
}
ol.index li, div.index ol li, div.index h3 {
    float: left;
    width: 20em;
    list-style-type: none;
    margin-left: 0;
    margin-right: 0;
    overflow: hidden
}
div.index h3 {
    font-size: 160%;
    width: 12.5em;
    margin-right: 0.2em
}


Общее количество слов в Индексе по буквам
- 67
А 8357
б 9280
в 12972
г 7224
д 8366
ж 1397
з 7740
и 5261
й 85
к 14166
л 4463
м 9674
н 12979
о 12737
п 32479
р 9314
с 18208
Т 7636
у 4462
ф 3778
х 2564
ц 1311
Ч 2278
ш 2788
щ 418
ы 11
э 3148
ю 459
я 861


Количество строк по страницам текущего Индекса
  • "-" - 71
  • Ё - 78
  • А - 971
  • Аб - 383
  • Ав - 957
  • Аг - 356
  • Ад - 366
  • Ак - 580
  • Ал - 897
  • Ам - 418
  • Ан - 1646
  • Ап - 318
  • Ар - 954
  • Ас - 493
  • Ат - 245
  • Аэ - 357
  • Б - 312
  • Ба - 1827
  • Бе - 2731
  • Би - 887
  • Бл - 621
  • Бо - 1314
  • Бр - 929
  • Бу - 1021
  • В - 2311
  • Ва - 1015
  • Ве - 1438
  • Вз - 683
  • Ви - 1207
  • Вн - 407
  • Во - 2328
  • Вс - 683
  • Вы - 3326
  • Г - 353
  • Га - 1173
  • Ге - 1123
  • Ги - 1150
  • Гл - 561
  • Го - 1508
  • Гр - 1174
  • Гу - 511
  • Д - 623
  • Да - 522
  • Дв - 664
  • Де - 2064
  • Ди - 1169
  • До - 2611
  • Др - 577
  • Ду - 515
  • Е - 983
  • Ж - 379
  • Жа - 254
  • Же - 451
  • Жи - 452
  • З - 1032
  • За - 6158
  • Зе - 378
  • Зо - 353
  • И - 1540
  • Из - 1496
  • Ин - 1266
  • Ис - 1152
  • Й - 94
  • К - 689
  • Ка - 3111
  • Кв - 428
  • Ки - 969
  • Кл - 715
  • Ко - 5458
  • Кр - 1839
  • Ку - 1321
  • Л - 730
  • Ла - 880
  • Ле - 1055
  • Ли - 1006
  • Ло - 703
  • Лу - 394
  • М - 555
  • Ма - 2852
  • Ме - 2068
  • Ми - 1613
  • Мн - 507
  • Мо - 1730
  • Му - 696
  • Н - 417
  • На - 5181
  • Не - 5988
  • Ни - 928
  • Но - 771
  • О - 1848
  • Об - 3598
  • Ог - 347
  • Од - 654
  • Ок - 697
  • Оп - 916
  • Ор - 645
  • Ос - 1153
  • От - 3301
  • П - 860
  • Па - 2425
  • Пе - 5127
  • Пи - 933
  • Пл - 1098
  • По - 11913
  • Пр - 9213
  • Пс - 600
  • Пу - 717
  • Р - 298
  • Ра - 5403
  • Ре - 1865
  • Ри - 315
  • Ро - 880
  • Ру - 569
  • Ры - 342
  • С - 261
  • Сё - 39
  • Са - 2091
  • Сб - 220
  • Св - 1248
  • Сг - 151
  • Сд - 146
  • Се - 1825
  • Сж - 62
  • Сз - 11
  • Си - 1198
  • Ск - 1387
  • Сл - 825
  • См - 635
  • Сн - 298
  • Со - 2194
  • Сп - 1114
  • Ср - 335
  • Сс - 100
  • Ст - 2600
  • Су - 1403
  • Сф - 96
  • Сх - 140
  • Сц - 83
  • Сч - 128
  • Сш - 41
  • Съ - 65
  • Сы - 237
  • Сь - 7
  • Сэ - 31
  • Сю - 58
  • Ся - 32
  • Т - 741
  • Та - 1064
  • Те - 1887
  • Ти - 502
  • То - 1181
  • Тр - 1915
  • Ту - 686
  • У - 1126
  • Ув - 283
  • Уг - 322
  • Уд - 307
  • Ук - 305
  • Ул - 314
  • Ум - 385
  • Уп - 384
  • Ур - 337
  • Ус - 614
  • Ут - 455
  • Ф - 377
  • Фа - 728
  • Фе - 525
  • Фи - 760
  • Фл - 320
  • Фо - 961
  • Фр - 359
  • Х - 488
  • Ха - 500
  • Хи - 305
  • Хл - 402
  • Хо - 635
  • Хр - 447
  • Ц - 194
  • Ца - 134
  • Цв - 114
  • Це - 569
  • Ци - 462
  • Ч - 301
  • Ча - 413
  • Че - 1083
  • Чи - 357
  • Чу - 361
  • Ш - 411
  • Ша - 619
  • Ше - 538
  • Ши - 404
  • Шк - 121
  • Шл - 185
  • Шп - 201
  • Шт - 330
  • Шу - 269
  • Щ - 433
  • Ъ - 4
  • Ы - 31
  • Ь - 4
  • Э - 886
  • Эк - 862
  • Эл - 704
  • Эн - 329
  • Эп - 214
  • Эс - 185
  • Эт - 188
  • Ю - 505
  • Я - 917

Обсуждение[править]

В английской версии вики-словаря (Index:English/a1) применены очень интересные стили.
В частности, там все слова разбиты на колонки, при этом количество колонок зависит от ширины окна браузера (благодаря css-стилям "width: 20em" и "float: left").
Выяснил, что достигается это за счет наличия дополнительных сss-классов в английском викисловаре (ссылка на его css). В css-стилях русского викисловаря (ссылка на наш css) я таких классов не обнаружил.
Вопрос: можно ли их (css-классы) как-то добавить в русских викисловарь и что для этого нужно сделать?
Я попытался отыскать нужный код, в частности нас явно интересует класс ".index". По поводу остального — скорее всего достигается шаблонами. -- Vitalik7 (обсуждение) 19:39, 2 августа 2013 (UTC)[ответить]

Я за адаптивный дизайн. Добавил классы для index в MediaWiki:Common.css. Попробовал применить для страницы Индекс:Английский язык/A, Индекс:Русский язык/А и Индекс:Русский язык/А/г. Есть несколько замечаний для применения этого стиля. Во-первых, пришлось убрать пометки, что слово из орфографического словаря Лопатина. Они слишком длинные. Я не вижу в них особого смысла, но если сократить, то их можно вернуть. Во-вторых, я убрал содержание. Оно слишком громоздко. Но в шаблоне {{Русский индекс}} ссылки формируются на двухбуквенные заголовки, а они у нас трёхбуквенные. Это нужно исправить. И в-третьих, часть индексов вынесено на отдельные страницы. Например раздел Индекс:Русский язык/А#аг ссылается на Индекс:Русский язык/А/г. Наверно вместо ссылки лучше сделать подстановку включением. Don Rumata 10:10, 3 августа 2013 (UTC)[ответить]
Отлично, Спасибо большое! Получилось просто замечательно!
Я уже успел попробовать альтернативное решение: нашел в википедии очень интересный шаблон "кол" (описание) и скопировал его сюда. Он автоматически разбивает список на нужное фиксированное количество колонок. Пример использования приведу ниже. Однако "адаптивный дизайн" с использованием css-класса .index, здесь подойдет, конечно, намного лучше, т.к. количество колонок в нем меняется автоматически.
По поводу адаптивного краткого содержания (список ссылок на подразделы) и прочего, я, кажется, разгадал, как это сделано в английском викисловаре и смогу применить это для нашего.
"Подстановка включением" - имеется в виду просто скопировать содержимое подраздела в основной раздел?
У меня есть идеи по переразбитию индекса по страницам, почему бы не сделать это как в английском викисловаре? Чуть позде напишу более подробно и с точными цифрами.. --Vitalik7 (обсуждение) 11:27, 3 августа 2013 (UTC)[ответить]
Да, а по поводу пометки "Орфографический словарь. Сост. Лопатин" — ее ведь можно сделать просто нумерованной сноской, как в обычной википедии (секция "Примечания"). В дальнейшем туда могут добавляться и другие словари. По-моему, было бы очень удобно. --Vitalik7 (обсуждение) 11:34, 3 августа 2013 (UTC)[ответить]
Гм.. По поводу "примечаний" частично беру свои слова обратно. Именно тот самый механизм использовать не получится. Но что-то подобное подходящее, думаю, придумать можно. Подумаю. --Vitalik7 (обсуждение) 12:50, 3 августа 2013 (UTC)[ответить]
Мне кажется, чем меньше страниц будет в индексе, тем лучше.
В английском викисловаре сделали по 1-2 страницы на букву, при чем если идет деление на две страницы, то строго по буквами m-n.
У нас именно так красиво, к сожалению, сделать не получится (специфика распределения слов по буквам), но в целом как идея — ведь довольно неплохо!
В связи с этим вопрос: сколько максимум слов считается нормальным и допустимым иметь на странице? И по каким критериям определяется это количество?
Для информации: в текущем разбиении встречаются и тысяча, и две, и пять и даже почти двенадцать тысяч (Индекс:Русский язык/П/о). --Vitalik7 (обсуждение) 11:55, 3 августа 2013 (UTC)[ответить]
Я тоже не вижу большого смысла в помете о словаре.
Однажды я открыл страницу в ВС, и браузер просто заглох. Какая точно страница, не помню. В общем, делить индекс нужно примерно по байтам; не больше трёхсот, наверное.
Желательно также завести бот, аналогичный тому, что в английском ВС. Ведь индекс весьма неполный, и вручную его никто, кажется, не обновляет.--Cinemantique (обсуждение) 13:24, 3 августа 2013 (UTC)[ответить]
Спасибо за ответ!
По поводу пометах о словарях.. Их можно сделать, например, так: Участник:Vitalik7/Русский_язык/Р1 и не навящиво выглядит, и информация есть. (Р1 - эта страница не включена в индекс, создаю ее для примера по образу английского ВС)
Пока этот словарь только один - польза действительно сомнительная. Но если подключить и другие орфографические, толковые и прочие словари, то тогда резонов использовать эту помету будет больше, как считаете? К слову, планирую в ближайшем времени заняться этим.
По поводу размера страницы — имеется в виду объем wiki-текста, или объем всей получающейся html-страницы целиком?
Для сравнения: wiki-текст буквы "О": 57 Кб, html-страница: 516 Кб; wiki-текст для "Ра": 195 Кб, а максимальный сейчас wiki-текст для "По": 406 Кб.
По поводу бота.. Считается таковым любой скрипт, автоматизирующий работу с ВС или же он должен быть обязательно написан на определенном языке с использованием определенных библиотек?
Мои скрипты на питоне, библиотеки пока никакие не использую, работаю с вики как "обычный браузер" по http.. --Vitalik7 (обсуждение) 13:57, 3 августа 2013 (UTC)[ответить]
Я в этом вопросе некомпетентен. Может, другие редакторы подскажут… Знаю только, что для бота заводится отдельная учётная запись, от имени которой совершаются правки; и тот самый бот обрабатывает дамп базы данных Викисловаря. Кое-что рассказано здесь. Что касается ссылок на словари: их можно указывать в самих статьях. Для чего они нужны в индексе, неочень понятно. Разве что для красных ссылок.--Cinemantique (обсуждение) 14:33, 3 августа 2013 (UTC)[ответить]
По поводу ссылок на словари: как тогда быть со словами, которых еще нет в Викисловаре? Ведь тогда будет не совсем понятно, откуда слово было добавлено в индекс. --Vitalik7 (обсуждение) 14:38, 3 августа 2013 (UTC)[ответить]
Да, вот я и упомянул красные ссылки. Хотя нужны ли они там вообще? Полезнее будет список недостающих статей вынести в отдельное место. Да и ботом будет проще обрабатывать индекс.--Cinemantique (обсуждение) 14:43, 3 августа 2013 (UTC)[ответить]
Если так, то согласен. Получается: 1). нужна отдельная страница с недостающими словами, на которой будут указываться ссылки на словари-источники (да и вообще на любые источники использования "нового" слова), 2). на существующих страницах нужна секция (возможно уже существует?), где можно размещать информацию о том, в каких словарях слово присутствует. Верно?.. --Vitalik7 (обсуждение) 14:55, 3 августа 2013 (UTC)[ответить]
Красные ссылки это нестрашно. Массовое добавление слов в индексы хорошо бы сначала обсудить. Если решение будет принято, то словарь-источник можно будет указать в комментарии к правке. Don Rumata 14:56, 3 августа 2013 (UTC)[ответить]
Я имел в виду: для начала добавить то, что уже есть в ВС, но отсутствует в индексе. Добавление вручную — это не самый эффективный способ, как мне кажется.--Cinemantique (обсуждение) 15:11, 3 августа 2013 (UTC)[ответить]
Так у нас индекс — это «список всех слов, которые включены в какие-либо словари». А для чего такое уточнение?..--Cinemantique (обсуждение) 15:22, 3 августа 2013 (UTC)[ответить]
добавить то, что уже есть в ВС, но отсутствует в индексе — правильно ли я понял: т.е. автоматически добавить в индекс те слова, которые уже есть в ВС, но в индекс добавлены еще не были, так? --Vitalik7 (обсуждение) 15:40, 3 августа 2013 (UTC)[ответить]
А вообще запутался, не очень понял, к чему именно относятся последние два сообщения?.. :( --Vitalik7 (обсуждение) 15:40, 3 августа 2013 (UTC)[ответить]
На главной странице справа есть колонка автоматических индексов статей. Ручные индексы, это нечто вроде координационных списков в Википедии. Don Rumata 15:43, 3 августа 2013 (UTC)[ответить]

Возможно как-то подвести итоги обсуждений (которые были здесь, а также в Обсуждение_индекса:Русский_язык и Обсуждение_участника:Vitalik7#Индексы)?
Что уже решено, что еще не решено, но можно решить, а что вообще не может сейчас решиться?

  1. Разрешается ли и нужно ли добавить в Индекс:Русский язык все недостающие слова из Категория:Русский язык в полуавтоматическом режиме?
    Если да, то тогда актуальны следующие вопросы 2, 3, 5 и 6.
  2. Использование адаптивного "float-стиля" (<div class="index">) можно считать утвержденным для Индекса?
    • Если да, то как быть со ссылками на словари (см. следующий вопрос 3 ниже)
  3. Нужны ли ссылки на словари в Индексе? (этот вопрос по идее решить сейчас не представляется возможным, т.к. нет всех заинтересованных участников)
    Т.к. решить определенно этот вопрос пока нельзя, то немного другой вопрос: как следует поступать со страницами Индекса сейчас, если их редактировать?
    • Удалить пометку о Лопатине, но если будет принято решение, что она в Индексе нужна, то потом просто вернуть в полуавтоматическом режиме (сделано сейчас таким образом со страницами Индекс:Русский язык/А и Индекс:Русский язык/А/г).
    • Оставлять пометку о Лопатине. Если так, то тогда в каком виде:
      1. Использовать шаблон Орфографический словарь. Сост. Лопатин (если использовать адаптивный float-стиль, то будет некрасиво, слишком длинные строчки)
      2. Заменить на сноску ref (если использовать адаптивный float-стиль, то будет некрасиво, объяснение здесь в конце со скриншотом: Обсуждение_участника:Vitalik7#Индексы)
      3. Заменить на <sup>[1]</sup> или что-то в этом роде (аналогичное замечание-недостаток, что и для сноски)
      4. Заменить на <small>[1]</small> или что-то в этом роде (оформленное в виде шаблона), при этом можно делать или не делать ссылки, это уже другой вопрос.
        Внешний вид вроде приемлемый.
      5. Оставить любую другую пометку, хоть просто звездочку.
      • Если использовать сноски или <sup>, то можно попробовать найти решение глюков с float-стилями, но пока ничего в голову не приходит.
  4. Нужна ли нам отдельная страница со словами, которые есть в индексе, но еще нет в ВС (т.н. красные слова)?
    Некоторые мысли по этому поводу:
    • Ее можно составлять автоматически на основании Индекса (просто выбирать оттуда все красные слова)
    • Предполагается, что на такой странице будут ссылки на источники, откуда слово появилось, взято.
    • Если генерировать такую страницу автоматически на основании Индекса, то и в Индексе такая информация должна быть.
      • Но в принципе, наверное, не обязательно, т.к. можно выцеплять из индекса только новые, если таковые будут там появляться и помечать их как-то по-особому
    • Можно добавлять новые слова на эту страницу (либо вручную, либо автоматически из других источников и т.п.).
      • При этом по идее эти же слова должны появиться и в Индексе тоже.
  5. Нужно ли более подходящее переразбиение страниц индекса? И какое?
    • Мне, например, кажутся немного неудобными ссылки вида "см. аб", т.к. приходится несколько раз переходить по ссылкам от страницы к странице, чтобы дойти до нужного слова.
    • В этой связи, а также благодаря использованию адаптивного float-стиля, можно увеличить объем страниц и соответственно уменьшить их общее количество.
    • Добавил выше информацию о том, сколько слов мы сейчас имеем по буквам и по страницам Индекса
    • Можно заметить, что сейчас на странице обычно до 1000 слов, но также довольно часто встречается и 2000, около пяти раз по 5000 и один раз даже почти 12000
    • Я предлагаю разбить слова на страницы по 4-6 тыс. слов. Тогда чуть больше половины букв будет занимать по одной странице, остальные по две. Исключения составят только буквы "П" и "С", у которых 32 и 18 тыс. слов соотственственно, их можно разбить по 4-5 страниц.
    • Можно придерживаться совершенно другой политики и разбивать слова на большее количество страниц и делать эти страницы мельче, но тогда очень желательно сделать удобную систему перекрестных ссылок между разделами (см. след. вопрос 6)
  6. Система ссылок на страницы индекса (буквы А, подразделы из содержания, подразделы на отдельных страницах и прочее, одно-, двух- и трехбуквенные)
    Следует ли подвергнуть ее изменениям и как?
    • Содержание, как заметил Don Rumata, слишком громоздкое и его нужно заменить на более экономный и красивый вариант
    • Автоматическая генерация всех двухбуквеных ссылок (аа, аб, ав, ...) не совсем целесообразна, т.к. не все ссылки будут рабочими
    • Соответственно надо сгенерировать двухбуквенные ссылки на основании слов, содержащихся на странице, лучше всего это сделать автоматически.
    • При этом можно вставить такой блок рядом с каждым двухбуквенным заголовком, используя механизм section аналогично английской версии ВС, а можно и не делать этого.
    • Можно сделать в трехбуквенных секциях ссылки на другие трехбуквенные секции и на родительскую двухбуквенную. В двухбуквенной секции ссылки на другие двухбуквенные. И "корневые" однобуквенные вверху и внизу страницы.
    • А можно просто сделать один большой блок и разместить в нем и все двухбуквенные и трехбуквенные ссылки. Или же только те двухбуквенные и трехбуквенные, которые соответствуют текущей странице. (опять же можно это первый раз сделать автоматически, сгенерировать и вставить)

У меня завтра почти свободный день и я бы мог заняться этими моментами (закончить и запустить скрипты и вставить результаты их работы).
Если есть мнение, что это имеет смысл, либо же хотя бы нет мнений, что это смысла не имеет, то я с удовольствием этим займусь.
Только хочется получить ответы (хотя бы приблизительные или предположительные) на главные вопросы. Или хотя бы ответ о том, что некоторые из них будут конкретно решаться позже.
Т.к. основную работу будет делать скрипт, то большую часть моментов можно будет потом легко переделать иначе. Но делать много напрасной работы тоже не хочется.
Вот вроде и всё. Надеюсь ничего не упустил. --Vitalik7 (обсуждение) 18:36, 3 августа 2013 (UTC)[ответить]

Еще забыл добавить 7-й пункт: наполнение Индекса словами из других словарей: Ефремовой, Ожегова, Даля и пр.

И еще есть замечательная новость, кажется удалось побороть глюк с использованием сносок вместе с адаптивным float-стилем.
Поэкспериментировав выяснил, что для этого надо добавить в css-стили:

ol.index li sup, ol.index li small {
    line-height: 1;
}

По поводу вопросов выше: не обязательно исчерпывающий и окончательный ответ, хотя бы некоторые мысли, которые помогут понять и оценить целесообразность и нужность работы, а так же то, в каком виде ее можно для начала сделать. --Vitalik7 (обсуждение) 10:01, 4 августа 2013 (UTC)[ответить]

Есть у нас такое правило ВС:НББ. Всё это полезно и нужно, но предлагаю подождать возвращения Vesailok. Хотелось бы услышать его мнение на этот счёт. У него как-никак > 1000 правок в пространстве Индекс. Don Rumata 10:51, 4 августа 2013 (UTC)[ответить]
Согласен, это разумно и правильно. А когда ориентировочно возвращается Vesailok? За "всё это полезно и нужно" - спасибо, этих слов достаточно, чтобы попробовать проделать эту работу.
Попрошу только сделать небольшую правку css, о которой написал чуть выше (сейчас внес в нее дополнительное изменение - добавил похожий момент и для тега small)
Еще прощу разрешить создать и использовать шаблон ? (для информации о словаре в Индексе), он не вступает ни с кем в конфликт, зато используя его в своей песочнице в таком виде - очень легко будет потом перенести изменённые страницы Индекса из песочницы в основное пространство (если таковые изменения будут в дальнейшем одобрены).
Сейчас на свежую голову родились идеи о том, как можно поступить со ссылками на двух- и трехбуквенные подразделы. При этом решение является универсальным и его можно будет удобно применить для любого способа разбития слов на страницы. Я могу попробовать сегодня запрограммировать генерацию страниц в таком виде, далее разместить результаты в песочнице, затем можно обсудить их здесь, дождаться возвращения Vesailok и после этого учтя все замечания и внеся все изменения разместить полученные страницы в Индексе. Я правильно понимаю ситуацию? --Vitalik7 (обсуждение) 11:54, 4 августа 2013 (UTC)[ответить]


Многое, к сожалению, пока не успел. Есть следующие идеи: Участник:Vitalik7/Русский_язык/Р. Предлагаю к рассмотрению-обсуждению.

  • Оглавление
    • Сделал отдельную секцию (подзаголовок) для оглавления, преимущества:
      • Так его легче отдельно редактировать, не загружая всю огромную страницу в редактор
      • Так на него можно ссылать снизу из подразделов
    • Первая строка в оглавлении — это обычные все те же ссылки на страницы-буквы
      • Предлагаю использовать символ "#" вместо "-", преимущества:
        • Он будет гораздо виднее и заметнее, чем дефис
        • Позволяет под собой логически использовать не только слова на "-", но и на цифры и другие символы, в том числе англ. буквы (есть и несколько русских слов)
        • Сама ссылка может быть, например, как в англ. ВС: Русский_язык/0
    • Вторая строка в оглавлении — это ссылки на двухбуквенные секции
      • Если перехода на новую страницу нет, а лишь вниз к заголовку, то рядом с ссылкой разместил символ ↓
      • Если это переход на новую страницу, то такого символа нет, зато добавил нумерацию таких страниц и в третей строке ссылки на их подразделы
      • Если мы уже находимся на отдельной двухбуквенной странице, то соответствующая ссылка становится жирной
      • Учтены все ньюансы перекресных переходов между секциями
    • Третья строка в оглавлении — это ссылки на трехбуквенные подразделы на двухбуквенных страницах
      • Учтены все ньюансы перекресных переходов между разными секциями
      • Если выглядит слишком громозодко, можно заменить на таблицы или вообще оставить только одну строку для текущей двухбуквенной секции, а все остальные не показывать
    • Оглавление было сгенерировано автоматически на основании слов - для каждой страницы индивидуальное (разные ньюансы для однобуквенных и двухбуквенных страниц)
      • Первая строка общая, можно использовать шаблон
      • Остальные же строки - прописаны явно (вставлен сгенерированный вариант)
        • Автоматизировать иначе не получится т.к. нет смысла автоматически делать всевозможные ссылки даже на несуществующие разделы (как было раньше)
        • Разве что можно сократить текст используя какой-нибудь шаблон, но не знаю, целесообразно ли это, он и так невелик.
      • Изменяться этот единоразово сгенерированный вариант оглавления будет крайне редко, может даже никогда.
        • В крайнем случае добавить новую двухбуквенную ссылку вручную не составит труда
        • Однако мне кажется, что все это должно будет происходить автоматически с помощью скрипта
  • Основной список слов
    • Собственно перед каждым подзаголовком сделал ссылку ↑ наверх к оглавлению-указателю
    • Пометка о словаре — отдельная тема, которая еще не решена. Пока что это шаблон, который можно будет заменить на что угодно
    • Секции-ссылки под каждым разделом (как в англ. вики) решил все-таки не делать. Согласен, что может получиться громоздко и излишне.
    • Остальные моменты реализовать пока не успел, но дело осталось за малым.
    • Абсолютно всё можно переиначить и переделать, как скажете.

Буду благодарен за любые мысли, советы, замечания и вопросы. --Vitalik7 (обсуждение) 21:23, 4 августа 2013 (UTC)[ответить]

Да, это именно из-за сносок (и вообще любых элементов типа sup или small), но это легко решается, достаточно лишь добавить пару строчек в css-стили, я выяснил какие именно и написал выше.
С пометками в скобках хорошая идея, так будет гораздо читабельнее. Но недостаток в том, что текста занимает больше..
По поводу пометок еще одна интересная идея появилась: Участник:Vitalik7/Русский_язык/Р, шаблон, в который передается инфорамция о словарях: "одна буква - один словарь" через пробел. Если параметров нет, то идет маленький знак вопроса. При этом благодаря тому, что сноски есть у всех слов - не происходит никаких перекосов. И довольно компактно и красиво вроде вышло.
По поводу цифр в оглавлении - да, может это и лишнее.. Просто сделал их, чтобы визуально легче найти по двухбуквенному слогу соответствующую трехбуквенную строчку..
Как вообще считаете, целесообразно размещать блочок со всеми ссылками на трехбуквенные подразделы или оставлять только одну единственную трехбуквенную строчку для текущей страницы (если таковой имеется)? --Vitalik7 (обсуждение) 12:03, 5 августа 2013 (UTC)[ответить]
Гм.. Сделал вопросик красным, чтобы выделялся относительно остальных букв Л.. Но можно в принципе цвет и убрать.. или сделать другим, например, серым.. --Vitalik7 (обсуждение) 12:09, 5 августа 2013 (UTC)[ответить]

Сделал краткий вид содержания. Только две строки. Третья строка показывается только для больших двухбуквенных страниц. Кажется, это именно то, о чем говорил Дон Румата в самом первом сообщении здесь.
Примеры: Участник:Vitalik7/Русский_язык/О и Участник:Vitalik7/Русский_язык/О/т
-- Vitalik7 (обсуждение) 20:07, 5 августа 2013 (UTC)[ответить]

От составителя индекса[править]

Пришло, наверное, время прокомментировать мне как создателю системы русского индекса в Викисловаре в том виде, какой он был к началу обсуждения. Я вижу бурную деятельность и не совсем понимаю её целесообразность. Английский индекс мне не нравится в смысле информативности - он там просто содержит автоматически обновляемый список ссылок на имеющиеся статьи про русские слова. Зачем это нужно, если это легче провернуть категориями - непонятно. Наш же индекс я изначально сделал (как было замечено) как "наиболее полный список русских слов". Практически независимо от словарей (Лопатина или Викисловаря). Указывать источник слов я считаю необходимым - если возникает сомнение в правомерности включения в индекс, это легко верифицировать. Я собрал этот индекс из 3 списков - имевшегося на тот момент индекса (в несколько раз меньшего, чем теперь), всех русских статей Викисловаря на тот момент (2010 год) и имевшегося у меня словника словаря Лопатина (не самого нового, надо полагать). Теперь в свете данного видения могу ответить на оставшиеся вопросы из опросника:

1) да
2) оформление меня не сильно интересует, я не против любых изменений, если не теряется информация
3) пометы должны быть. В каком виде - неважно, главное - однозначные.
4) Есть технический список Викисловарь:Требуемые статьи/ru, в который можно генерировать красные ссылки из индекса. По нему успешно работает Vesailok, вследствие чего у него и много правок в индексе.
5) Я выделял подстраницу, если в каком-то разделе появлялось более 200-300 слов. Если будут другие разумные предложения - могу изменить эту настройку.
6) Исправленная навигация мне очень не нравится. Я попробую написать шаблон с помощью Lua, чтобы двух- и трёх-буквенные инициалы вели на правильные места в индексе. Либо можно сделать это вручную (тогда обновление структуры нарушит ссылки).

Итог: я могу полуавтоматически обновить индекс с учётом пожеланий. Но я строго стою за пометы о словарях и (естественно) за наличие красных ссылок. Лопатинский словарь был выбран как наиболее полный, поэтому думаю, что учёт других словарей просто почти ничего не добавит. Даль - особый вопрос, требует отдельного обсуждения. --Infovarius (обсуждение) 17:04, 7 августа 2013 (UTC)[ответить]

Который из вариантов навигации не понравился? Первый предложенный, который действительно получился довольно громоздкий (Участник:Vitalik7/Русский_язык/Р) или новый краткий (Участник:Vitalik7/Русский_язык/О), который по сути мало чем отличается от прошлого, ведь стили и внешний вид можно установить какие нужно, основные его отличия: ссылки на трехбуквенные разделы, наличие только существующих ссылок на двухбувенные, стрелочки вниз чтобы показать, что переход на текущей странице, стрелочки вверх для перехода в оглавление. Предполагаю, что в "очень не нравится" речь шла о первом варианте, что скажете про второй? Если тоже не нравится, то чем именно?
Правильно ли я понял общее настроение сообщения: мои усилия по генерации страниц индекса не особо нужны и важны, т.к. уже и так есть скрипты, которые всё это сделают? --Vitalik7 (обсуждение) 17:27, 7 августа 2013 (UTC)[ответить]

Использование других словарей для формирования индекса[править]

К слову об использовании других словарей. Подготовил некоторую статистику на тему:

"Сколько новых слов есть в других словарях по сравнению со словарем Лопатина (speakrus.ru: lopatin)?"
Словарь Источник Количество
слов в словаре
Количество новых
слов
1. Орфографический словарь Лопатина (новая версия) lopatin.academic.ru 164 570 слов 3 016 новых слов
2. Современный толковый словарь Ефремовой speakrus.ru: efremova *123 573 слов 26 379 новых слов
3. Современный толковый словарь Ефремовой academic.ru: efremova 134 758 слов 32 653 новых слов
4. Орфографический словарь-справочник Букчина academic.ru: rus_orthography 105 997 слов 76 169 новых слов
5. Малый академический словарь Евгеньева academic.ru: mas 80 271 слов 4 193 новых слов
6. Толковый словарь Кузнецова academic.ru: kuznetsov 79 109 слов 7 182 новых слов
7. Толковый словарь Ожегова academic.ru: ogegova 68 126 слов 8 806 новых слов
8. Толковый словарь Ушакова academic.ru: ushakov 86 371 слов 11 481 новых слов
9. Толковый словарь Дмитриева academic.ru: dmitriev 6 013 слов 68 новых слов
10. Толковый словарь Даля academic.ru: enc2p 44 734 слов 27 941 новых слов
11. Словарь Зализняка speakrus.ru: zalizn *93 220 слов 6 802 новых слов
12. Словарь Про-Линг speakrus.ru: proling *125 495 слов 50 072 новых слов
13. Cловарь синонимов Абрамова speakrus.ru: abramov *19 043 слов 5 150 новых слов

* Количество слов у словарей, скачанных с сайта speakrus.ru, указано с вычетом словосочетаний (просто была раньше у меня такая необходимость).
Могу позже посчитать для них статистику без вычета словосочетаний, тогда "новых слов" будет немного больше. Но общей картины это не изменит. -- Vitalik7 (обсуждение) 21:19, 7 августа 2013 (UTC)[ответить]

Понятное дело, что новые слова у этих словарей пересекаются, и наверняка львиная часть из них уже есть в викисловаре. Но все равно количество новых слов, я думаю, будет ощутимым и останавливаться только на словаре Лопатина не стоит. -- Vitalik7 (обсуждение) 21:19, 7 августа 2013 (UTC)[ответить]
Сейчас заметил еще одну неточность статистики. За основу статистики мною был взят словарь Лопатина (отсюда (speakrus.ru: lopatin)), но с вычетом словосочетаний. Поэтому есть погрешность максимум в 3 тыс. Но тем не менее порядок общего количества новых слов сохраняется. --Vitalik7 (обсуждение) 07:21, 8 августа 2013 (UTC)[ответить]
Уже около недели мои последние изменения в этом разделе (5 правок) помечены как "не проверенные".. Может кто-нибудь их отпатрулировать?.. Есть некоторая причина по которой это не делается или просто так сложилось, что никто еще не проходил мимо этого раздела?.. --Vitalik7 (обсуждение) 10:36, 13 августа 2013 (UTC)[ответить]
Cinemantique, спасибо! --Vitalik7 (обсуждение) 18:02, 13 августа 2013 (UTC)[ответить]
Вы подняли очень важную тему, если я правильно понял, у вас всё готово для её технической реализации, тем печальнее наблюдать, что это начинание так ничем и не завершилось. Надеюсь, индексы будут обновлены... Кстати, хотелось бы увидеть обновление не только этих индексов, но и автоматического обновление обратного словаря - сейчас он практически не обновляется, он особенно ценен когда он полон.--Petroglyph (обсуждение) 11:36, 21 октября 2013 (UTC)[ответить]
Гм.. Дело в том, что у меня сложилось впечатление (возможно ошибочное), что я выполняю напрасную работу, которую применить здесь не получится в виду общих скептических настроений или настороженных отношений..
Я не хочу никого обидеть, повторюсь, что просто сложилось такое впечатление. Исходя из сообщения Infovarius мне показалось, что он как создатель русского индекса воспринял мою деятельность в штыки и не особо видит в ней смысла. На всякий случай я уточнил, но ответа не получил. Дальнейшие мои сообщения висели "не проверенными" некоторое время (скорее всего просто так сложилось, что никто не проходил мимо, но тем не менее тоже некоторый показатель).
Вобщем, лето прошло, время, когда есть возможность очень плотно и активно заняться увлекательным делом. Интерес к теме у вики-сообщества показался сомнительным: с одной стороны вроде бы есть одобрение, что дело нужное, но с другой стороны такое ощущение, что сложно ее воплотить "новичку" со стороны, как будто есть некоторое противодействие. Изначально загорелся вики-идеологией, очень замечательна мысль, что каждый может вносить свой вклад в общее дело. Но оказалось, что не все так радужно. Поэтому сначала немного разочаровался, а потом просто начались трудовые будни.. К сожалению, ближайший месяц у меня очень большая нагрузка на двух работах. Но когда появится возможность, то хотел бы возобновить работу. К тому же были и другие идеи на счет развития вики-словаря. Но, опять же, нужна обратная связь от администраторов проекта и заинтересованных лиц.. Как я понимаю, без их одобрения ничего не получится. --Vitalik7 (обсуждение) 13:35, 21 октября 2013 (UTC)[ответить]
Я выступаю За это начинание, однако же советую всё-таки исключить словарь Даля из массива "объединяемых" словарей — уж слишком много там диалектизмов, в том числе исчезнувших ещё в XIX-м веке. — soshial@ 14:20, 21 октября 2013 (UTC)[ответить]
Я не старожил проекта и тем более не администратор, я такой же, как вы, новый участник Викисловаря, но позволю себя высказать свою точку зрения. Насколько мне известно, на вики-сайтах не принято бурно поддерживать те или иные начинания, действия и т. д. Если задуматься, этому легко находятся объяснения: а) Большинство потребителей никогда не занимаются комментированием, лайками и т. д. (многим другим проектам присуща подобная группа поддержки). б) Активные авторы... чем больше они работают над такими проектами, тем меньше у них свободного времени на комментарии, так как перед ними всегда стоит выбор - потратить время на комментирование, или сделать что-то полезное, в Викисловаре работы непочатый край. в) Если в обсуждении кто-то высказал вашу аргументацию, её не принято повторять, а отсутствие возможности лайкнуть то или иное высказывание не позволяет понять какое количество участников разделяют ту или иную мысль. г) во всех подобных проектах действует принцип правьте смело, т. е. для улучшения чего-то старого или создания нового не нужно получать каких-то одобрений свыше. Я сам недавно присоединился к проекту, успел почувствовать его необычно высокую элитарность для проектов с плоской структурой, и низкую доброжелательность к новичкам, закрытость и т. п. Но всему этому легко находятся объяснения, проект маленькие, участники хорошо друг друга знают, а времени на различные руководства и формализацию тех или иных принципов нет. Мне приятно, что в проект приходят новые участники, так как в проекте настолько широкий фронт работ, что без увеличения количества участников Викисловарь хотя и будет развиваться (как делал все эти годы), но делать это будет медленнее чем хотелось бы и несбалансированно. По этой причине, нужно что-то делать порогом участия, открытостью проекта и доброжелательностью к новым полезным участникам (вандалов и шутников выносим за скобки). Относительно патрулирования, мне показалось что вы не совсем правильно интерпретируете эти пометки. В каком-то смысле это не более чем формальность, факт патрулирования не означает официального "одобрения", это техническая пометка об отсутствии вандализма и соблюдении некоторых принципов. Будем ждать возобновления вашей активности, а какие другие идеи если не секрет? А по Далю... согласен, его лучше вынести за скобки, возможно создать отдельный список только для Даля (с красными ссылками).--Petroglyph (обсуждение) 14:36, 21 октября 2013 (UTC)[ответить]
Спасибо большое за разъяснения и поддержку! Я постараюсь вернуться к работе, когда снова появится свободное время (ориентировочно в декабре). По поводу других идей, они были связаны с тем, чтобы загрузить к себе в некоторую базу все словарные статьи (в какой-то степени вроде успел на тот момент это сделать), затем проанализировать их на предмет либо несоответствия стандартам (заметил, что старые и новые статьи по формату могут сильно отличаться), либо наличия ошибок, либо отсутствия некоторых элементов (например, можно было бы попробовать автоматизировать вставку ссылок на такие же слова в викисловарях на других языках) и прочее. Ну и генерация различных отчетов и списков (например, тот же "Обратный словарь русского языка", думаю, было бы не очень сложно сделать) --Vitalik7 (обсуждение) 13:49, 22 октября 2013 (UTC)[ответить]
О! Да мы вообще с Вами, Виталик, в одном направлении думаем! Я тоже давно думаю насчёт глобальной проверки всех статей на соответствия и кое-что в этом направлении уже начал делать. В частности, я уже могу скачивать статьи по списку и генерировать для него вот такие отчёт (и списки с недостатками, если надо будет): Обсуждение приложения:Список частотности по НКРЯ. Дальше можно только наращивать функционал по выявлению недостатков. Я уже начал писать функцию для полного перечисления недостатков в статье. Её можно будет использовать для подсказок в конкретной статье (видимо, пока только лично для меня, т.к. код не масштабируется) и составления списков по недостаткам. Infovarius (обсуждение) 07:58, 23 октября 2013 (UTC)[ответить]
  • Для меня обсуждение остановилось на осознании того, что я не понимаю, для чего предназначен данный список. Если, как сказал Don Rumata, «это нечто вроде координационных списков в Википедии», то там должны быть только красные ссылки, и он мог бы быть полезным инструментом. Если не так, то что это? Говорят, Даля нужно исключить. Что же это за список — современный литературный лексикон? Как это в принципе должно быть использовано?--Cinemantique (обсуждение) 15:00, 21 октября 2013 (UTC)[ответить]
    Гм.. Я думаю, это мог бы быть просто некий аккумулированный список слов из различных словарей, постепенно претендующий на некоторую полноту. В викисловаре чтобы добавить слово нужно написать для него статью; даже если она очень короткая - все равно это требует некоторого времени и усилий. В индексе слов же достаточно только упоминания этого слова; следовательно он может пополняться гораздо легче и быстрее. И соответственно может быть более полным. Вот как-то так я понимаю. Дополнительные бонусы: красные ссылки и возможность посмотреть, в каких словарях слово представлено. В дальнейшем может быть еще какую-нибудь краткую инфу можно предоставлять в индексе. --Vitalik7 (обсуждение) 13:49, 22 октября 2013 (UTC)[ответить]
    Поддерживаю Виталика. Вкратце - это должен быть полный список слов русского языка с указанием АИ (словарей), где можно проверить существование слова. Infovarius (обсуждение) 07:58, 23 октября 2013 (UTC)[ответить]
  • Возражу по поводу словаря Даля и поясню следующее: многие слова, указываемые как устаревшие (в Москве или в Питере) могут использоваться в глубинке России и на окраинах её, а также -- за рубежами многонациональной Федерации, т.к. русскоговорящие люди живут на многих континентах и во многих странах Мира, -- зачастую, сохранив дореволюционный говор и даже письменность; возможно, что для некоторых из подобных слов необходимо делать некую помету-напоминание, однако, не раз встречались слова и фразы, мне, очень хорошо известные и используемые за Уралом, в Сибири, в Казахстане (в местах не столь отдалённых, -- как говорится: -- для ссыльных, в своё время русских и говорящих по-русски, и особенно -- их детей и внуков, а порою и правнуков тоже), которые отмечены как "устаревшие". Устаревшие, -- для кого и где? Даже не учитывая зарубежа, Россия очень велика. Кстати, пример такого уже рассматривался здесь. По поводу же АИ в корне неверное заявление, т.к. АИ могут быть не только словари, но и газеты и журналы, радио- и телевизионные передачи, книги и брошюры... напечатанные по-русски, и даже сохранившиеся черновые рукописные материалы или -- говор, услышанный во дворе и на улицах от русскоговорящих людей.

Или что-то изменилось где-нибудь в css, или у нас давно куча плохо оформленных шаблонов-таблиц. P.S. Я про "слипание" ячеек и отсутствие пробелов между ними. --Infovarius (обсуждение) 14:49, 2 августа 2013 (UTC)[ответить]

Я так понимаю, кто-то просто пожадничал, выделяя проценты ячейкам. ;) --Al Silonov (обсуждение) 16:32, 2 августа 2013 (UTC)[ответить]
Да, наверное, парсер html шалеет от 146% :) Но сейчас ячейки находятся в левой части таблицы на весь экран, хотелось бы как-то отцентрировать. --Infovarius (обсуждение) 11:13, 3 августа 2013 (UTC)[ответить]

TemplateData[править]

Господа, нам добавили расширение mw:Extension:TemplateData. Оно позволяет документировать параметры шаблона в формате JSON, который вскоре будет использоваться в визуальном редакторе. Пример документации см. в шаблоне {{аббр.}} Don Rumata 12:01, 29 июля 2013 (UTC)[ответить]

Китайский иероглиф[править]

Идеологический вопрос - иероглиф - это первый уровень (язык) или второй уровень (часть речи)?

Вопрос по шаблону {{-Hani-}}. У нас - это уровень языка (первый уровень). В enwikt - это уровень указания части речи (POS), см. Hanzi на en:Wiktionary:Entry layout explained/POS headers.

Можно сравнить статью по иероглифу у нас и в enwikt en:爱. Мне кажется правильным второй подход - сначала указывать язык, а внутри раздела писать - это иероглиф, сущ. или гл. Если вы согласны, то можно было бы попросить ботоводов:

  1. понизить уровень {{-Hani-}}, т.е. добавить = ... =
  2. добавить уровнем выше язык. Не знаю какой... китайский? -- Andrew Krizhanovsky (обсуждение) 23:18, 28 июля 2013 (UTC)[ответить]
Уже обсуждали Викисловарь:Организационные вопросы/2011#Секция кандзи. Наши американские коллеги условно разбили части речи на уровни. В лингвистическом смысле никаких уровней у частей речи нет — они все равны. Забавно видеть у них на втором уровне русские имена собственные. Иероглиф это знак письменности. Как знак он у нас, подобно букве, описывается под заголовком первого уровня (соответствует секции Translingual в английском разделе Викисловаря). А его значение в соответствующих языковых разделах. Некоторые знаки кандзи имеют слегка отличающееся написание в японском и китайском . А есть ещё кокудзи. Don Rumata 05:25, 29 июля 2013 (UTC)[ответить]
Румата, спасибо большое за ссылку! Примеры в том обсуждении (Участник:シリョガ/人 и Участник:シリョガ/人2) мне понятны и меня вполне устраивают в смысле структуры статьи: сначала указан язык, потом всё остальное...
Такая разница в структурах будет интересным преткновением для желающих объединить информацию двух викисловарей :)
В наш викисловарь "кокудзи" ещё не проникли? -- Andrew Krizhanovsky (обсуждение) 06:56, 29 июля 2013 (UTC)[ответить]
Но я всё же считаю, что дополнительно нужно описывать сам знак, подобно а#Буква (кириллица)) и a#Буква (латиница). Don Rumata 07:25, 29 июля 2013 (UTC)[ответить]
  • В настоящее время все браузеры различают специфичную кодировку и можно не указывать слов "буква", "кириллица", "латиница" и т.д. по отношению к буквам алфавита. Можно напечатать A -- латинский или А -- русский и вы попадёте именно туда куда надо. То же самое и с греческим, арабским и т.д.

Автосоздание статей о французских словах[править]

Надо бы исправить шаблон для автоматического создания французских слов, что-то там не так. Пытался создать frapper, но пришлось потрудиться, чтобы привести в нормальный вид, и то, думаю, ещё не всё. --- Vesailok 19:03, 26 июля 2013 (UTC)[ответить]

А что там не так? Можно по-конкретнее? Don Rumata 20:37, 26 июля 2013 (UTC)[ответить]
Например, выбрал слово ressembler, слова не было, подтверждаю создать, французский язык, глагол 1 спряжение и получаю недоделанную статью: ressembler. --- Vesailok 10:32, 27 июля 2013 (UTC)[ответить]
Пришлось поправить эти два шаблона (для французских глаголов). Но, видимо, надо кому-то повнимательнее просмотреть все шаблоны для создания статей. --- Vesailok 13:38, 27 июля 2013 (UTC)[ответить]

Боты[править]

Скажите, а в связи с новыми изменениями старые боты работать будут? --- Vesailok 20:13, 24 июля 2013 (UTC)[ответить]

Вы про какие изменения? --Infovarius (обсуждение) 14:26, 26 июля 2013 (UTC)[ответить]
Я про это сообщение: "... Pywikipedia is migrating to Git so after July 26, SVN checkouts won't be updated If you're using Pywikipedia you have to switch to git, otherwise you will use out-dated framework and your bot might not work properly...." --- Vesailok 18:49, 26 июля 2013 (UTC)[ответить]
Конечно, боты работать будут. Просто потребуется их обновлять по-другому. --Infovarius (обсуждение) 07:32, 27 июля 2013 (UTC)[ответить]

Модернизация Шаблон:автор[править]

Предлагаю избавиться от гигантского switсh в {{автор}}. Предлагаемый способ я запрограммировал в {{автор2}}. Для добавления нового автора достаточно будет создать шаблон автор/имя автора, например, для Пушкина: {{автор/Александр Пушкин}} и перенаправления {{автор/А. С. Пушкин}}.

Например, {{автор/Ernest Hemingway}} и перенаправления {{автор/Эрнест Хемингуэй}}, {{автор/Hemingway}}, {{автор/Хемингуэй}}, {{автор/Э. Хемингуэй}}, {{автор/E. Hemingway}}.

Также предлагаю использовать его же для имени переводчика, только тогда надо будет добавлять поддержку род. п. -- Sergey kudryavtsev (обсуждение) 13:33, 19 июля 2013 (UTC)[ответить]

Есть одно очень важное ограничение, которое мешает активно использовать функцию #ifexist — она является ресурсоёмкой и количество её вызовов ограничено. Если эта функция вызывается больше чем 99 раз, то её исполнение прерывается, а страница, на которой произошло превышение попадает в категорию Страницы со слишком большим количеством вызовов ресурсоёмких функций. Подробнее читайте w:Википедия:Пределы шаблонов. Don Rumata 13:55, 19 июля 2013 (UTC)[ответить]
Мне это известно по Викитеке, но предел составляет не 99, а 500 вызовов на страницу, этого мне кажется достаточным. -- Sergey kudryavtsev (обсуждение) 14:18, 19 июля 2013 (UTC)[ответить]
Да, вы правы — 500, но нагрузка на сервер всё равно возрастёт в разы, особенно для страниц с большим количеством примеров. Don Rumata 14:21, 19 июля 2013 (UTC)[ответить]
Так, как шаблон {{автор}} вызывается из шаблона {{пример}}, количество вызовов которого на странице ничем не ограничено, а вы еще и предлагаете вызывать её и для переводчиков, то предел будет достигнут довольно быстро. Это не единственная ресурсоёмкая функция, так например на странице take down их уже 22. Предлагаю отказаться пока от такой способа и перевести шаблон на Lua. Don Rumata 14:16, 19 июля 2013 (UTC)[ответить]
Может быть, Lua - это и лучший вариант, попробую сделать, используя в качестве примера ваш блок переводов. -- Sergey kudryavtsev (обсуждение) 14:22, 19 июля 2013 (UTC)[ответить]
Однозначно менее ресурсоёмкий. Одно дело проверить существует ли страница в индексе из миллионов страниц, а другое найти ключ пусть и в большой в таблице в памяти. Don Rumata 14:28, 19 июля 2013 (UTC)[ответить]

Господа, я полностью переписал шаблон {{перев-блок}} на Lua. Новую версию шаблона можно посмотреть в песочнице и на странице тестов. Собственно код шаблона находится в модуле Модуль:languages, который использует собственную таблицу кодов языков в Модуль:languages/data. В принципе эту таблицу можно расширить и избавиться от кучи шаблонов в категории Викисловарь:Шаблоны:Языки, которых для каждого кода языка по три. Например: {{-ru-}} {{ru}} {{lang-ru}}. Ваши пожелания приветствуются. Don Rumata 22:08, 17 июля 2013 (UTC)[ответить]

Ещё хотел посоветоваться. Как лучше оформлять список переводов таблицей или навигационным блоком, как это было? И как делить колонки? По старому с помощью {{table-top}}, {{table-mid}}, {{table-bot}} или по-новому через CSS? Новый вариант не поддерживается некоторыми старыми браузерами, например IE < 10 (см. CSS Multiple column layout), но старый вариант ужасно выглядит в мобильной версии. Don Rumata 22:30, 17 июля 2013 (UTC)[ответить]
Предлагаю не оглядываться на старые версии браузеров: они рано или поздно догонят, и люди рано или поздно обновятся. Главное пожелание: добавление перевода без необходимости редактировать статью, как это сделано в английском Викисловаре. Это правда значительно ускорит работу. Есть вторичное пожелание: чтобы, как в англвики, была ссылка на статью о слове в родном Викисловаре соответствующего языка — возможно ли подобное? Спасибо большое. — soshial@ 23:07, 17 июля 2013 (UTC)[ответить]
Хочется объединить этот модуль с моими шаблонами {{Язык по коду}}, чтобы они работали универсально. Например, чтобы можно было получить количество статей в категории через {{PAGESINCAT:{{Язык по коду (И)|ru}}}}. Потому, что например {{PAGESINCAT:{{ru}} язык}} не работает. И естественно объединить списки языков. --Infovarius (обсуждение) 18:59, 20 августа 2013 (UTC)[ответить]

Одуш. + неодуш.[править]

Я уже всё перерыл, добрался досюда, но так и не понял: могу ли я и как (и нужно ли) включить дополнительные падежные формы, если слово может выступать как в значениях одушевлённого, так и неодушевлённого? Прошу разъяснить.--Cinemantique (обсуждение) 13:52, 17 июля 2013 (UTC)[ответить]

В настоящее время (хотя я в душе с этим не согласен), если существительное обозначает и неодушевленный предмет, и одушевленное лицо, то мы делаем два подраздела. Я бы, конечно, предложил делать в одной таблице формы для од. и для неод., но только там, где есть оба значения. Как это осуществить, я не знаю. --- Vesailok 13:58, 17 июля 2013 (UTC)[ответить]
То есть делаются как омонимы? Осуществление должно быть связано с семейством шаблонов. Насколько это проблематично, могут сказать разработчики этих шаблонов.--Cinemantique (обсуждение) 14:50, 17 июля 2013 (UTC)[ответить]
Есть шаблоны {{одуш.}} и {{неодуш.}}, но лучше их использовать только в случае, когда и парадигма склонения и этимология совпадают. Шаблоны добавляют статью в соответствующие категории. В редких случаях используется шаблон {{также}} с параметром тип=d, но его, по-моему, лучше не использовать. Don Rumata 17:25, 17 июля 2013 (UTC)[ответить]
С пометами понятно. Этимология совпадает. Парадигма тоже, кроме винительного падежа, разумеется. Что с ним-то делать? Сделать бы как у прилагательных.--Cinemantique (обсуждение) 17:35, 17 июля 2013 (UTC)[ответить]

Обновление быстрой вставки[править]

Предлагаю кое-что отредактировать в области быстрой вставки. Может, кто-то захочет присоединиться и выскажет свои пожелания?

  1. обновление IPA: добавить с заменой d͡ʒ, t͡ʃ, t͡s, d͡z; также добавить ɪ̯.
  2. в самом начале строки «Вики-разметка» идут две одинаковых вставки — [[|]].--Cinemantique (обсуждение) 10:06, 17 июля 2013 (UTC)[ответить]
По первому — да, возможно. По второму: эти элементы не одинаковы; оба рассчитаны не только на «пустое» добавление, но и на оформление уже выделенного фрагмента, и действуют они по-разному — один служит для случаев типа [[|тетрадей]] (то есть в скобки берется нелемматизированная форма), другой — для [[тетрадь|]] (для леммы). --Al Silonov (обсуждение) 10:37, 17 июля 2013 (UTC)[ответить]
Да, действительно. Просто в ВП такого не было.--Cinemantique (обсуждение) 10:42, 17 июля 2013 (UTC)[ответить]

й - Язык "Кириллица"[править]

Вначале обычно указывается язык. Вроде бы, нет такого языка "Кириллица". Предлагаю в статье й - первый раздел или удалить или... не знаю. У англичан - два раздела "Русский", "Украинский" ("й" - оказывается конъюнкция :) -- Andrew Krizhanovsky (обсуждение) 10:41, 15 июля 2013 (UTC)[ответить]

Может, все символы под заголовком {{-mul-}} держать? а в значении указывать, к какому алфавиту/языку они относятся. --Infovarius (обсуждение) 12:59, 15 июля 2013 (UTC)[ответить]
Буквы мы оформляем по заголовком второго уровня «Буква (кириллица)», как в статьях а, б, в. Don Rumata 18:20, 15 июля 2013 (UTC)[ответить]

Нет учетной записи? Присоединиться к Викисловаря[править]

До залогинивания - вот такое белым по зелёному предложение: "Присоединиться к Викисловаря". Кто может исправить? Fractaler (обсуждение) 17:45, 27 июня 2013 (UTC)[ответить]

 Исправил. Такая ошибка может быть везде, где используется конструкция {{grammar:genitive|{{SITENAME}}}}. Don Rumata 05:49, 28 июня 2013 (UTC)[ответить]
Теоретически должно быть {{grammar:dative|{{SITENAME}}}}, но пока это не работает. См. mw:Help_talk:Magic_words/ru. В комментариях в модуле LanguageRu.php написано «These rules are not perfect, but they are currently only used for Wikimedia site names so it doesn’t matter if they are wrong sometimes. Just add a special case for your site name if necessary». Боюсь подстраиваться под наш проект они не будут, а для Википедии дательный и родительный падеж совпадают. Don Rumata 06:05, 28 июня 2013 (UTC)[ответить]

Интервики-бот[править]

Заметил, что в последние несколько месяцев интервики-боты в нашем разделе не работают. Так и задумано, они запускаются лишь время от времени? А если да - то с какой периодичностью? --Maks Stirlitz (обсуждение) 01:09, 23 июня 2013 (UTC)[ответить]

Хм, боюсь, все "умерли" в связи с введением Викиданных. В Википедиях точно блокировали всех интервики-ботов. Не знаю, почему и из Викисловаря ушли... Кажется, внедрение Викиданных "поверх" Викисловарей уже поставлено в план, происходит обсуждение деталей: d:Wikidata:Wiktionary. Ещё интересное обсуждение - m:Wiktionary future. Infovarius (обсуждение) 19:16, 23 июня 2013 (UTC)[ответить]
Поскорее бы внедрили - это бы значительно упростило работу с интервиками. Здесь бы это помогло даже больше, чем в Википедии - так как интервики-конфликты у нас невозможны в принципе =)
Кстати, в других разделах (в английском, в частности) боты работают как обычно. --Maks Stirlitz (обсуждение) 08:47, 24 июня 2013 (UTC)[ответить]
Как можно прочитать в обсуждениях, планируется нечто большее - например, единая база произношений, этимологий, переводов. :) --Infovarius (обсуждение) 13:47, 24 июня 2013 (UTC)[ответить]

Модули[править]

Господа, не нужно плодить модули непонятного назначения. Для экспериментов есть testwiki:. Давайте сначала обсуждать необходимость тех или иных модулей в нашем проекте. Don Rumata 13:26, 20 июня 2013 (UTC)[ответить]

Для удобства и связки, нельзя ли автоматом поставить шаблон {{wikipedia}} на все соответствия статейных наименований там и здесь?

Не так просто. 1) надо проверять наличие статей; 2) лучше статьи здесь связывать с неоднозначностями там, а из заголовков статей там выделять одно слово для ссылки сюда. В общем, автоматом это постараться надо. --Infovarius (обсуждение) 09:36, 18 июня 2013 (UTC)[ответить]

Заливка глаголов без видовой пары и двувидовых[править]

Обнаружил случайно на просторах вот такой документ. Ценность представляет довольно большую, потому что внести подобную информацию можно на Викисловарь автоматически, прописывая в шаблоны словоизменения |соотв=- и |2в=1. Подскажите кто-нибудь, как такое можно сделать автоматически или хотя бы с человеческой supervision. — soshial@ 10:59, 12 июня 2013 (UTC)[ответить]

Неужели невозможно сделать полуавтоматическую заливку? Я бы проконтролировал, например, результаты. — soshial@ 17:48, 16 июня 2013 (UTC)[ответить]
Это можно сделать, например, с помощью AutoWikiBrowser. Я могу. Покажите пример такой правки, и ещё кто-нибудь подтвердите целесообразность этой работы. --Infovarius (обсуждение) 09:34, 18 июня 2013 (UTC)[ответить]

Перевод[править]

А что бот не может взять из Википедии перевод имеющихся слов (в виде соответствия наименований статей) и вставить в табличку переводов соответствующей статьи здесь? Кстати, там подобный бот уже давно существует. Его чуточку подправить, и -- сюда.

Не может. Ибо полисемия. -- Andrew Krizhanovsky (обсуждение) 06:52, 12 июня 2013 (UTC)[ответить]
И не только. В этих проектах совершенно разные концепции наименования статей (если встречаются совпадения, это обычно случайность, в большинстве случаев несовпадения грамматического числа, написания прописных/строчных букв и т. п.), есть и другие препятствия. --Al Silonov (обсуждение) 08:26, 12 июня 2013 (UTC)[ответить]
Хотя бы то, что соответствует "случайно". И то меньше работы бы было людям. Наименования местности, русалка, лев и т.д. Что соответствует, то и возьмёт -- добавляя новое, если там тоже появится.
А вообще, я согласен. Было бы удобно для тех слов, в которых ты уверен, просто нажать на кнопочку и оно сразу выдал бы список для вставки в область переводов. Времени бы сэкономили тучу. — soshial@ 15:01, 12 июня 2013 (UTC)[ответить]
Можете воспользоваться гаджетом для переформатирования списка интервик в список переводов - см. последний в секции Редактирование. Копируете секцию интервик из статьи Википедии, вставляете в статью в словаре, выделяете её всю, нажимаете кнопку "iw" в панели редактирования. Гаджет всего-лишь превращает вики-ссылку в строчку таблицы "перев-блок". После этого ещё требуется 1) убрать simple-википедию; 2) убрать скобочки-уточнения в названиях; 3) привести к ед.ч., если получится; 4) заменить первые буквы с заглавных на маленькие, кроме de/als/bar и т.п. нем. языков. К сожалению, сейчас этим сложнее пользоваться из-за внедрения Викиданных - большинство интервик теперь хранится там. Можно взять из последней редакции статьи, содержащей интервики в тексте. Для себя я сделал на Mathematica скриптик, который делает то же самое, извлекая интервики из Викиданных. --Infovarius (обсуждение) 09:33, 18 июня 2013 (UTC)[ответить]

Старинные формы или диалектическое слово[править]

Нужен бот[править]

Необходимо создать "бот" для написания и добавления шаблона со словами повелительного наклонения (а возможно, -- по такому же принципу и подобию, -- иных изменённых слов) в новые и уже существующие стати. Слова, в пример предложения по созданию такого бота -- ◆ суй и/или куй , которые являются не только татарскими и перенаправление без пояснений тут неуместно.— Эта реплика добавлена участником 173.68.93.220 (о · в) 20:06, 7 июня 2013‎

Это не первоочередная задача. Don Rumata 16:15, 7 июня 2013 (UTC)[ответить]
А у всех одна и та же единственная и повторимая задача?! Это предложение для всех и кто-то (знающий и разбирающийся в ботах) её может осуществить без проблем. — Эта реплика добавлена участником 173.68.93.220 (о · в) 20:19, 7 июня 2013‎
Уже многократно это обсуждали. Сейчас нет необходимости раздувать количество страниц в словаре в десятки раз формами слов. Пожалуйста, зарегистрируйтесь и подписывайте ваши реплики. Don Rumata 16:24, 7 июня 2013 (UTC)[ответить]
Это не "раздувание страниц", а словарные пояснения. Это же не бумажное издание, ограниченное форматом и/или размером. Зато словарь будет более полным и понятным при поиске конкретного слова. Кроме того, машина быстрее справится с таким делом, чем человек. Тут многое можно было бы уже давно сделать при помощи ботов. — Эта реплика добавлена участником 173.68.93.220 (о · в) 20:28, 7 июня 2013‎
Уважаемый, аноним! Все решения в Викисловаре принимаются в результате обсуждения. См. правило ВС:КС. Обсуждение этого вопроса уже неоднократно было. Пока общее мнение сообщества в том, что время этим заниматься ещё не наступило. Don Rumata 16:33, 7 июня 2013 (UTC)[ответить]
Если "обсуждение этого вопроса уже неоднократно было"(!), означает только одно: интерес к данному вопросу и необходимость его осуществления постоянно присутствует (и не только для меня), а соответственно и "время" упускается (интерес к проекту может быстро угасать, не находя нужного). — Эта реплика добавлена участником 173.68.93.220 (о · в) 20:42, 7 июня 2013‎
Уважаемый Don Rumata, большая просьба тут предоставить ссылку(-и) на подобное обсуждение — хочу туда влепить своё невеское 'за повременить'. — soshial@ 18:54, 7 июня 2013 (UTC)[ответить]
Цитата из ВС:ПН — «На данном этапе развития Викисловаря создание статей для всех форм слов не является ни приоритетной, ни первоочередной задачей.» Don Rumata 19:49, 7 июня 2013 (UTC)[ответить]
А очерёдность, и, тем более -- приоритет, здесь совершенно не при чём: это может делаться параллельно и вполне самостоятельно -- никому не мешая, но помогая очень. Каждый может делать свою работу, согласно знаний и умения.
Лично я не против такой ботозаливки. Просто сейчас в нашем словаре многие десятки тысяч статей-болванок и статей без значений, и неплохо было бы улучшать подобные статьи. Это моё мнение. --LEANSER
Я лично за такую ботозаливку (ситуация с суй и куй, действительно, неподобающая). Но для меня легче её будет провести, когда большая часть статей будет содержать полный шаблон словоизменения - тогда сообразно этому шаблону заливка будет точной и полной. Понятно, что этого счастливого момента ждать можно очень долго, поэтому надо будет поставить какую-нибудь рамку типа 90% или 50% или ещё какую-нибудь. Я вот только соберусь с мыслями и сделаю статистику, сколько уже есть. Infovarius (обсуждение) 17:06, 8 июня 2013 (UTC)[ответить]

Анекдоты в примеры[править]

Словарные пометы в разделе "Синонимы"[править]

Скрепя сердце приходится отказываться от словарных помет в виде шаблонов в разделах "Семантические отношения" и "Переводы" (см. [2]). Отказываться, т.к. пометы сокращений содержат категории, в которые автоматически помещаются статьи, в которых есть такие шаблоны.

Шаблоны словарных сокращений позволяют уменьшить число опечаток и ошибок. Поэтому я предлагаю убрать из словарных помет категории и свободно пользоваться шаблонами сокращений во всех тех разделах, где они могут быть уместны, а не только в описании толкования. -- Andrew Krizhanovsky (обсуждение) 10:57, 26 мая 2013 (UTC)[ответить]

  • Сама идея как мне кажется правильная, но над реализацией нужно думать. Можно сделать отключение категории как дополнительный параметр к шаблону с пометами? Тогда и волки будут сыты, и овцы целы. Сами текущие категории - вещь полезная для мониторинга и поиска. Если убрать стилевые категории такой мониторинг будет затруднён (использовать "ссылаются сюда" не очень просто, и про эту возможность не все знают).--Petroglyph (обсуждение) 11:28, 26 мая 2013 (UTC)[ответить]
Чтобы довести идею до ума, надо сделать не только это. Помета - практически обязательная часть словарной статьи, она не только позиционирует лексему и категории ставит, но и оформляется особо. Сходные по смыслу элементы в семантических отношениях - факультативные примечания, не обязательные и не выделяемые особо (обычно даются в скобках). Можно, конечно, вставить в шаблон громоздку условную (отключающая половину функционала) конструкцию, но, ИМХО, овчинка выделки не стоит. --Al Silonov (обсуждение) 14:46, 26 мая 2013 (UTC)[ответить]
Параметр может быть и не громоздким. Например: {{разг.|-}}. Don Rumata 05:00, 27 мая 2013 (UTC)[ответить]
Ловко :) -- Andrew Krizhanovsky (обсуждение) 07:17, 27 мая 2013 (UTC)[ответить]
Кажется, реализовал. --Infovarius (обсуждение) 19:47, 1 июля 2013 (UTC)[ответить]

Длина слова[править]

Кто может ботом пройтись по словам из категории Категория:Слова из 5 букв, и строчку {{длина слова|5}} заменить на строчку {{длина слова|5|lang=ru}}, тем более там только русские слова. --- Vesailok 22:28, 24 мая 2013 (UTC)[ответить]

А зачем? Можно просто изменить в шаблоне категорию по умолчанию если язык не указан. Don Rumata 10:41, 25 мая 2013 (UTC)[ответить]
Я пройдусь. По умолчанию не надо - это будет как в Статьи, нуждающиеся в доработке: язык не указан - значит, неизвестно, какой язык (или XX). Infovarius (обсуждение) 13:49, 25 мая 2013 (UTC)[ответить]

Шаблон для фразовых глаголов[править]

Нашел на форуме давнее обсуждение этой темы. Думаю, нужда в создании отдельного шаблона для фразовых глаголов все же есть. Стандартный phrase не может отображать многого - например, словоизменения. --Maks Stirlitz (обсуждение) 15:48, 22 мая 2013 (UTC)[ответить]

Для какого языка вам нужен такой шаблон? Я как-то делал словоизменение фраз для башкирского языка. Там пришлось делать много шаблонов под каждую парадигму. Don Rumata 08:12, 23 мая 2013 (UTC)[ответить]
Для английского. --Maks Stirlitz (обсуждение) 12:21, 23 мая 2013 (UTC)[ответить]
А какое словоизменение может быть для английского языка? Для английских фразовых глаголов есть параметр тип=фг в шаблоне {{phrase}}. Don Rumata 07:51, 24 мая 2013 (UTC)[ответить]
Такое же, как и для обычных английских глаголов =). Формы инфинитива, 3 л. ед. ч., прош. вр., past participle и present participle. В английском разделе такое реализовано - см. например здесь. У нас можно было бы как-нибудь встроить шаблон {{гл en}} в {{phrase}}, чтобы он появлялся при прописывании параметра фг. --Maks Stirlitz (обсуждение) 09:10, 24 мая 2013 (UTC)[ответить]

Окно редактирования[править]

Хотел бы обратиться к тем, кто заведует скриптом, преобразующим окно редактирования из дефолтного в более удобный. Верхняя строка с кнопками у меня подгружается лишь с третьего раза, когда я редактирую статьи. А если редактирую категории, то вообще никогда не подгружается. Может ли кто-нибудь пофиксить подобное её поведение? Больше всего мне нужен знак ударения: если оно не подгрузится, то было бы удобно иметь такую вещь как {{подст:ударение}}? Спасибо. Ещё у меня есть просьба обновить списки спецсимволов (в самом низу под окном редактирования): могу ли я напрямую отредактировать их сам вручную (латышский/литовский, старославянские)? Soshial (обсуждение) 21:45, 10 мая 2013 (UTC)[ответить]

Поправил добавление кнопочек в тулбар. Про спецсимволы по-подробнее пожалуйста. Важно еще знать включена ли у вас улучшенная панель редактирования в настройках или нет. Don Rumata 15:48, 11 мая 2013 (UTC)[ответить]
Я говорил о наборах спецсимволов в выпадающих списках в самом низу (напр., символы IPA, кириллица, греческий и т.п.) - все они для быстрого доступа прямо под областью для "быстрого тегирования" находятся. "Улучшенная панель редактирования" включена. Soshial (обсуждение) 07:33, 12 мая 2013 (UTC)[ответить]
У меня отключена "улучшенная модель", работает всё нормально. --- Vesailok 09:59, 12 мая 2013 (UTC)[ответить]
«Улучшенная панель» — жуткая вещь, надо хлопотать о ее изъятии из Викисловаря. То есть не просто не полезная, а откровенно вредная вещь: ее элементы, нужные в Википедии, не используются в словаре вообще никогда. --Al Silonov (обсуждение) 11:23, 12 мая 2013 (UTC)[ответить]
Прямо даже страшно стало. А чем она отличается от "неулучшенной"? Какие элементы могут навредить? Soshial (обсуждение) 15:29, 12 мая 2013 (UTC)[ответить]
Вредят практически все функции физической разметки (размер шрифта, выделения, отступы): у нас должна использоваться логическая разметка, каждое выделение - не ради красоты, а ради выражения конкретного смысла; кроме того, у нас никогда напрямую не применяются таблицы (да и вставка картинок делается особым шаблоном). Это чисто словарная специфика. --Al Silonov (обсуждение) 11:27, 17 мая 2013 (UTC)[ответить]
Вроде бы я удалил все лишние «красоты» из улучшенной панели. Ничего вредить не должно. Don Rumata 20:38, 19 мая 2013 (UTC)[ответить]
Ещё одна просьба: при редактировании СО сделать нормальный шаблон при создании (без слова «статья»), и добавить кнопочку с четырьмя тильдами. Ignatus (обсуждение) 08:45, 17 мая 2013 (UTC)[ответить]
Кроме кнопочки с четырьмя тильдами просьба добавить тип правки "уточнение". Также, повторяю просьбу дать мне возможность отредактировать список букв латышско/литовских алфавитов. — soshial@ 11:00, 10 июня 2013 (UTC)[ответить]
Вы можете добавлять лично себе любые инструменты, символы и шаблоны, если что. Можете воспользоваться примером с моих страниц: здесь дополнительные шаблоны и здесь есть добавление типа правки "ссылки". --Infovarius (обсуждение) 16:53, 10 июня 2013 (UTC)[ответить]

Перев-блок[править]

Скажите, есть ли возможность реализовать в шаблон:перев-блок добавление переводов, как это сделано в английском Викисловаре? Это было бы безумно удобно. Soshial (обсуждение) 23:07, 2 мая 2013 (UTC)[ответить]

Возможность есть, но были разногласия о необходимости. Don Rumata 14:53, 4 мая 2013 (UTC)[ответить]
Вот это странно, какие? Я двумя руками за, но сложновато для меня такое провернуть. --Infovarius (обсуждение) 19:21, 4 мая 2013 (UTC)[ответить]
А какие выдвигались аргументы против? Английский шаблон более привлекателен, и не только по этому функционалу, но и по выводу/сноскам. Возможно, имеет смысл поднять обсуждение этого вопроса вновь?--Petroglyph (обсуждение) 11:32, 26 мая 2013 (UTC)[ответить]
С удовольствием. Где голосовать? Могу прямо здесь: я За. Soshial (обсуждение) 21:19, 26 мая 2013 (UTC)[ответить]

Ссылки на переводы с якорями[править]

Согласуется ли такое [3] оформление (в разделе переводов) с правилами? Или же этот пример рассматриваем только в качестве эксперимента, который пока что не является общепринятым? Считаете ли вы такое оформление удобным, коллеги? -- Andrew Krizhanovsky (обсуждение) 16:57, 28 апреля 2013 (UTC)[ответить]

Список слов[править]

Можно ли где-либо увидеть полный список слов викисловаря (желательно с разделением по языкам) в удобном для компьютера формате (например *.txt, каждое слово на новой строчке)? Нужно для написания программы. Заранее спасибо за ответ. Desired boy 09:38, 15 апреля 2013 (UTC)[ответить]

Боюсь, что в по-настоящему удобном виде нет (надо помнить, что помимо слов тут описываются морфемы, словосочетания, аббревиатуры и т. п.). Самое близкое по смыслу - это служебный список "Все страницы". --Al Silonov (обсуждение) 10:36, 15 апреля 2013 (UTC)[ответить]
Значит придется немного потрудиться... Просто я думал, что, возможно, кто-то уже выполнил эту работу за меня. Desired boy 11:18, 15 апреля 2013 (UTC)[ответить]
Можно брать из категорий - см. например Немецкий язык - там все слова автоматически собираются. Статический полный список держать не имеет смысла, т.к. состав постоянно меняется. Для русского языка есть Индекс:Русский язык - там почти полный список слов, правда в том числе и не существующих пока в виде статей. Там включены все статьи о русских словах Викисловаря по состоянию на 2010 год. Для скачивания ссылка есть в обсуждении. В принципе, могу постараться и составить список в любом формате. --Infovarius (обсуждение) 15:10, 15 апреля 2013 (UTC)[ответить]
Благодарю! Это то что мне нужно. Да здравствует новый джигурляндский язык! Desired boy 10:28, 16 апреля 2013 (UTC)[ответить]
Только не смейтесь) Язык очень(!) необычный и интересный! Desired boy 10:29, 16 апреля 2013 (UTC)[ответить]
Не понял про джигурляндский. Список только для русского. А языки конечно пока в Викисловаре не все представлены (всего лишь около 400 из около 7000). --Infovarius (обсуждение) 11:12, 16 апреля 2013 (UTC)[ответить]
Я разрабатываю новый джигурляндский (ht tp://vk.com/club44420706 - спам-фильтр блокирует нормальную ссылку) язык. Он состоит всего лишь из одного слова "грёзоблаженствующий". Буквы этого слова могут быть большими и маленькими; представив большие буквы как "1", а маленькие - как "0", мы получим номер слова в словаре в двоичной системе счисления. Наше слово из 19 букв способно представить 524288 (219) слов! Как Вам идея? Кстати, Ваш список - просто мечта! В нём есть даже мат! Сейчас я пишу программу-переводчик. Desired boy 11:37, 16 апреля 2013 (UTC)[ответить]
:) Это почти так же экзотично, как язык из пробелов. --Infovarius (обсуждение) 14:46, 16 апреля 2013 (UTC)[ответить]
Эзотерический язык программирования я кстати тоже пытался написать, но не очень хорошо получилось, и я отложил этот вопрос. Desired boy 15:11, 16 апреля 2013 (UTC)[ответить]
А не могли бы Вы составить подобный список для английского языка? А то я и его решил добавить. Desired boy 18:23, 17 апреля 2013 (UTC)[ответить]
Хочу доработать Индекс:Английский язык (из которого бы список следовал), но всё руки не доходят... --Infovarius (обсуждение) 19:31, 18 апреля 2013 (UTC)[ответить]

Шаблоны[править]

С шаблонами какая-то неразбериха и неудобство. К примеру: мамуля — женский род с шаблоном сущ ru f a 2a и вроде бы для слова папуля необходимо сменить лишь букву f (женщина) на m (мужчина), т.к. всё остальное должно быть одинаковым, но... как бы ни так. И такие несоответствия наблюдаются во многих шаблонах. Нет системы и/или систематизации.

Есть система, надо только уметь ею пользоваться. Слова типа непоседа, грязнуля, хапуга, папаша, и т. п. склоняются по образцу для женского рода, то есть шаблоны серии сущ ru f a (индексы 1a, 2a, 3a, 4a соответственно), но там надо указывать параметр можо (если чисто мужской род, то можо=мо, если общий/смешанный род, то можо=можо). --Al Silonov (обсуждение) 21:29, 12 апреля 2013 (UTC)[ответить]
Данные слова (папуля, красуля, дедуля, мамуля, дитя) не есть лишь М и/или Ж. Это уменьшительно-ласкательные термины и, соответственно, шаблоны должны быть иными и более понятными. Как-то бы надо попроще и попонятнее бы. И не лучше бы было сделать шаблоны по-русски?
ШАблон описывает только морфологию, при этом неважно, уменьшительные слова или нет. Проще не получится, словарь - не детский сад, а весьма специфическая профессиональная область, наивно думать, что можно делать его, не владея инструментарием; удобство/полезность инструмента не зависит от его названия. По-русски в данном случае - бессмысленное выражение, поскольку шаблон - не текст на каком-то языке, а сложная программистская структура. --Al Silonov (обсуждение) 21:46, 12 апреля 2013 (UTC)[ответить]
Не ша... и в таком случае необходим раздел пояснений частей шаблонов -- что какая буква или сочетание означает и как найти нужное с примерами из категорий или с отдельными словами, как это предусмотрено в любой химической или физической формуле.
Вот соберите конференцию лингвистов и филологов в МГУ или в Питере и выработайте единую для всех формулировку для подобных условностей.
Шаблон для слов папуля, дедуля, мамуля, но красуля(!), лапуля(!) можно создать из статьи дитя.
Кстати, простота словарного или энциклопедического издания -- не детский сад, да и в лингвистике, -- как и в филологии (от "чувствовать" и "любить" + "логика"), -- не требуется "инструментов", кроме условности в виде пера и чернил (с человеком, -- владеющим языком и родной словесностью). В данном случае, словом -- "проще", выражается не мудрить излишне, путаясь в иноземном наборе букв, а писать понятным русским языком -- подобрав соответствия и определив некую систему (систематику изменений в словах). — Эта реплика добавлена участником 173.68.59.64 (о · в)
Все подробно описано на странице Викисловарь:Использование словаря Зализняка. Don Rumata 08:31, 13 апреля 2013 (UTC)[ответить]

Дополнить[править]

В шаблон бы надо добавить, чтобы при можо= (можно!!!) указать только М и/или Ж и получить мужской, средний или женский род, а-то ж как-то не по-русски получается с "мо" и "жо". Кроме того, во многих шаблонах при этом можно ликвидировать вводящую в заблуждение буковку f или m.

Со словами бабулька / дедулька такая же проблема в шаблоне сущ ru f ina 3*a.— Эта реплика добавлена участником 173.68.59.64 (о · в)

Вот ещё[править]

В шаблоне гл ru 4b-т-сяСВ уже не только латинские буквы. Надо ж или всё по-русски, или всё по иноземному. И табличку отдельную для справки и пояснений.— Эта реплика добавлена участником 173.68.59.64 (о · в)

Условные сокращения: грамматические категории[править]

Вопрос задал здесь: Обсуждение шаблона:нареч.. -- Andrew Krizhanovsky (обсуждение) 15:26, 7 апреля 2013 (UTC)[ответить]

Куда делась спецстраница про активных участников? --Vesailok 05:06, 5 апреля 2013 (UTC)[ответить]

Коллеги, давайте здесь посчитаемся. А то меня спрашивают, сколько здесь труженников, я чешу маковку и говорю неопределённо: десять - двадцать... -- Andrew Krizhanovsky (обсуждение) 09:53, 5 апреля 2013 (UTC)[ответить]

  1. Vesailok 05:06, 5 апреля 2013 (UTC)[ответить]
  2. Andrew Krizhanovsky (обсуждение)
  3. А зачем? Это ж переменное число. Можно в wikimedia-stats смотреть по месяцам. --Infovarius (обсуждение) 09:59, 5 апреля 2013 (UTC)[ответить]
  4. --Maks Stirlitz (обсуждение) 12:09, 5 апреля 2013 (UTC)[ответить]
  5. А какое в данном случае определение термина "труженик"? Fractaler (обсуждение) 12:06, 6 апреля 2013 (UTC)[ответить]
  6. Russian Wiktionary at a glance. Тут подробненько с графиками и в сравнении с другими разделами Wiktionary Statistics. Don Rumata 13:51, 6 апреля 2013 (UTC)[ответить]

Спасибо, замечательная ссылка:

Да уж, не думал, что нас так мало, а популярность проекта настолько большая. Ну и что, будем работать потихоньку :) А в плане онлайн-словаря, Викисловарь в выдаче одним из первых идёт в Google'е. Soshial (обсуждение) 18:11, 7 мая 2013 (UTC)[ответить]

Создание статей из заготовок[править]

Постоянно пользуюсь стандартными заготовками для создания новых статей. В основном пишу статьи об английских словах и выражениях, поэтому хотелось бы, чтобы была создана заготовка для английских глаголов (сейчас приходится пользоваться стандартной заготовкой для глаголов и исправлять код языка с "XX" на "en"). Неплохо было бы сделать такое и для фразовых глаголов (сейчас приходится пользоваться заготовкой для словосочетания) - с включением туда шаблона словоизменения. Сделал бы сам, но, к сожалению, не очень разбираюсь в технических деталях, поэтому прошу знающих участников помочь. --Maks Stirlitz (обсуждение) 13:22, 29 марта 2013 (UTC)[ответить]

Посмотри мой инструментарий Участник:Al Silonov/monobook.js, можешь скопировать себе такой же. Он добавляет в нижнее меню множество полезных кнопок-функций, включая более удобные варианты создания статей о словах и словосочетаниях (кнопки NEW, NEW ru, NEW phrase). Я создаю статьи об иностранных словах с помощью кнопки-подстановщика NEW, там только надо научиться аккуратно подставлять параметры (в частности, код языка для английского слова надо указать лишь один раз, далее он размножится в нужных местах сам). Примеры приведены на моей странице Участник:Al Silonov/Заготовки. См. также {{NEW}}. --Al Silonov (обсуждение) 21:41, 12 апреля 2013 (UTC)[ответить]

Категория:Пометы_языковой_при%C2%ADнадлежности[править]

Могу я попросить переместить эту категорию на страницу без юникод символа &# xC2AD; (кот. находится внутри слова "принадлежность")? Soshial (обсуждение) 18:52, 15 марта 2013 (UTC)[ответить]

 Сделано. Don Rumata 22:11, 15 марта 2013 (UTC)[ответить]

Пространство Module[править]

Господа, нам добавили расширение mw:Extension:Scribunto и пространство Module: для хранения скриптов написанных на Lua. Я добавил библиотеку строковых функций Module:string из Википедии. Все шаблоны строк теперь используют его. Если есть запросы на создание скриптов со сложной логикой обращайтесь, я готов помочь их написать. Don Rumata 22:40, 13 марта 2013 (UTC)[ответить]

Хотелось бы иметь следующие строковые функции:
1. вернуть слово без последнего символа (например, для образования основы слова с окончанием -а)
2. вернуть слово без двух последних символов
3. "оглушить букву" (б->п, в->ф, з->с и т.п.) в конце основы
4. "озвончить букву" в конце основы
5. "смягчить" - изменить букву в конце основы типа к->ц, г->з и т.п.
Или я чего-то не то прошу? --Vesailok 10:58, 5 апреля 2013 (UTC)[ответить]
А для латинского желательно иметь строковую функцию снятия диакритики, т.е. заменить все гласные с макронами и бревисами на теже гласные без оных.
Vesailok, про п. 3—5, входом для функции будет являться "голая" основа? -- Sergey kudryavtsev (обсуждение) 17:23, 8 мая 2013 (UTC)[ответить]
К примеру, возьмём сербское слово апотека. Воспользуемся "откусыванием" последней буквы - получим основу. В дательном падеже мы не просто к основе добавляем окончание "и", но и "смягчаем" конечную согласную основы - "к" превращаем в "ц". Таким образом, мы можем объединить в один шаблон склонений (да и спряжений для глаголов) несколько шаблонов. Могу написать алгоритм, по которому определяются чередования корневых согласных (впрочем, и гласных) при словоизменениях. --- Vesailok 22:04, 8 мая 2013 (UTC)[ответить]
Пишите алгоритм, и желательно примеры сербских слов и шаблоны которые нужно объединить. Подробности можно изложить мне на СО. Don Rumata 11:06, 11 мая 2013 (UTC)[ответить]
Если нужно вернуть подстроку до какого-то символа с конца строки, работают отрицательные аргументы в функции Sub: {{#invoke:string|sub|строка|2|-2}}=трок. Infovarius (обсуждение) 08:29, 11 мая 2013 (UTC)[ответить]

Большая просьба сделать так, чтобы {{Rm acc}} вычищал от всех знаков ударения (если их несколько). Спасибо. — soshial@ 17:22, 3 августа 2013 (UTC)[ответить]

Деепричастие "лижа" не существует, см. стр. обс. Шаблон это ставит, как это убрать?Longbowman (обсуждение) 06:13, 16 февраля 2013 (UTC)[ответить]

Это вам так кажется. Существует. ◆ Иногда океан суров, а иногда и мягок ― часами обсасывает леденцы пляжей, омывает тверди грудь, кормит водный люд. Как хороший отец, следит за порядком. Кто голоден ― тому даст пищу, кто мал ― перенесет через лужи, избавит от лжи, уложит, лижа. М. Г. Гиголашвили, «Красный озноб Тингитаны: Записки о Марокко (2006)», 2008 г. // «Нева» [НКРЯ]. Don Rumata 13:55, 16 февраля 2013 (UTC)[ответить]
Это словесная игра. В языке такой формы не существует. Он мог написать и боять, и отсрачивать, и т.п. Longbowman (обсуждение) 14:31, 16 февраля 2013 (UTC)[ответить]
См. лизать ВС:ПРОВ. А каковы ваши доказательства? Don Rumata 14:57, 16 февраля 2013 (UTC)[ответить]
Пункт 2 этих правил, НКРЯ. Когда имеется явный случай словесной эквилибристики (в смысле форм), это нельзя признать употреблением.Longbowman (обсуждение) 15:05, 16 февраля 2013 (UTC)[ответить]
Нашёл у Майкова пример употребления (18-й век). --LEANSER
Давайте тогда здесь закроем, а продолжим только там: Обсуждение:лизать.Longbowman (обсуждение) 15:12, 16 февраля 2013 (UTC)[ответить]
Хорошо. Добавил туда очевидный пример употребления у Александра Грина. Don Rumata 15:18, 16 февраля 2013 (UTC)[ответить]

Scribunto extension roll out planned for February 18[править]

Wikimedia Foundation has been working on improving performance and adding features to template pages within MediaWiki. As a result of this WMF developed a new Scribunto extension for MediaWiki which enables Lua scripting language for templates. The developers are confident about the extension's maturity and it was decided that Scribunto is going to be deployed to this wiki in the first batch. The deployment will begin on February 18 and will simply add a feature. Please be so kind and spread the word about the deployment on your wiki. If you are interested in converting current templates to Lua, please see more information and submit your feedback to Lua page on Meta. Regards, Kozuch (обсуждение) 18:31, 13 февраля 2013 (UTC)[ответить]

Wow! It's great news for us all. Don Rumata 22:35, 13 февраля 2013 (UTC)[ответить]

Коды языков[править]

У меня язык Чероки (код chr) не отображается, см. переводы в статье бояться, см. добавление перевода. -- Andrew Krizhanovsky (обсуждение) 14:42, 1 января 2013 (UTC)[ответить]

 Сделано. Исправил. Don Rumata 11:59, 2 января 2013 (UTC)[ответить]

привет, sorry for my Russian, but I would like to tell you that we've found a solution to sort Ё in Категория:Русский язык between Е and Ж (currently it's after Z).

For 10 years the Mediawiki software has never managed our accents (we've got the same problem in French), but yesterday I've modified the equivalent of Шаблон:categ to add a new parameter "key=", and adding this key has affected Категория:Русский язык and not Категория:Болгарский язык. JackPotte (обсуждение) 11:55, 27 января 2013 (UTC)[ответить]

Праславянские и праиндоевропейские страницы[править]

Пожалуйста посмотрите обсуждение: Обсуждение категории:Праславянский язык. Rumpel77 (обсуждение) 18:52, 24 марта 2013 (UTC)[ответить]

Нужно вообще подумать о единстве оформления реконструированных языков. Наши коллеги из английского Викисловаря все статьи для реконструированных языков en:Category:Reconstructed languages оформляют в приложениях. Это не только корни en:Category:Proto-Indo-European roots, но и части речи en:Category:Proto-Slavic nouns. Don Rumata 07:19, 25 марта 2013 (UTC)[ответить]
Да мне понятно что надо подумать, вот теперь давайте подумаем об этом. Так же коллеги французы оформляют все статьи в приложениах. A тут бывают статья с названием Корень:dhe, *sestra и как нормальные страницы (wegh-, gǫsь).. Rumpel77 (обсуждение) 16:17, 25 марта 2013 (UTC)[ответить]