Участник:Vitalik/todo

Материал из Викисловаря

Викификация и ошибки[править]

Идеи для автоматически обновляемых отчётов[править]

  • Прилагательные
    • -[бвдзлмнпрстф]ый : прил ru 1(*)a...
    • -[бвдзлмнпрстф]ий : прил ru 2(*)a...
    • -[кгх]ий : прил ru 3(*)a...
    • -[жчшщ]ий : прил ru 4a...
    • -[ц]ый : прил ru 5a
    • -еий : прил ru 6a
    • -[бвдзлмнпрстф]ой : прил ru 1(*)b...
    • -[кгх]ой : прил ru 3b...
    • -[жчшщ]ой : прил ru 4b...
  • -ечек, -ёчек, -ичек, -очек, -учек, -ашек, -ешек, -ишек, -ошек, -ушек, -ышек -- содержат в индексе звездочку * или градус °
  • проверка шаблона "морфо": для начала ни один параметр не должен содержать дефисы, запятые. и вообще обычно это последовательность букв, иногда может быть в квадратных скобках
  • искать много согласных подряд (возможно это вандальная правка)

Другие идеи[править]

  • Проверять не просто смешение кириллицы и латиницы, а наличие букв не из алфавита
  • Добавить механизм исключений сюда: Викисловарь:Отчёты/Ошибки/Содержимое/Ошибки/Ударение_на_согласный
  • Проверять на смешение не только заголовки, но и текст статьи
  • Ошибки в использовании шаблона {{длина слова}} после того, как будет решено, как с ним быть
  • Наличие помет вне раздела значений, а также отсутствие у них указания языка
  • Некоторые специфичные моменты на проверку правильности фонетики (произношения)
  • Использование неправильных языковых заголовков
  • Поиск невидимых символов в заголовках (например, мягкий перенос)
    • и вот ещё кандидаты: '\xe2', '\x80', '\x8e'
  • Поиск невидимых символов в тексте (например, мягкий перенос)

Заголовки (структура статей)[править]

  • структура
    • примеры ущербной структуры: load
    • исправление уровня
    • добавление недостающих
    • проверить правильность порядка заголовков, а также отсутствие необходимых
    • убрать дублирование заголовков, пример: аллоэтноним
    • исправление "неизвестных"
    • сортировать заголовки второго уровня по алфавиту
  • заголовки второго уровня
    • отсутствие заголовка второго уровня при омоформах (примеры: логист, лордство, ...)
    • внедрение шаблона {{заголовок}} (только сначала разобраться как именно быть с омоформами)
    • пояснения в заголовках омоформ: [1], [2] ?
  • определённые разделы
    • избавиться от "Латиница (Latinça)"
    • решить что-то метаграммами/анаграммами.. Хорошая правка от Infovarius: [3]
  • разные интересные случаи:
    • встретил интересный заголовок: "Фонетические и фонологические свойства", пример: инфимум
    • раздел "Типичные сочетания", пример: озеро, легализовать или нет?
    • подразделы раздела "Производные слова", пример: за-, легализовать или нет?
    • Achilla: "Варианты имени", "Дериваты", "Соответствующее мужское имя — ?", "Аналог имени в русском языке — ?"
  • разное
    • словоформа со слогами как заголовок? примеры: берегу, голова#Сербский
    • поубирать пробелы после заголовка (после последнего равно!!)

Раздел "Морфология"[править]

  • параметры "соотв" доприводить в порядок
    • найти текст, который можно перенести в "соотв" (пример: [4])
    • круто! можно распарсить эти страницы и перенести инфу к нам
  • доразбираться со "слогами" (плюс идея избавиться от шаблона "по-слогам")
  • удалить пустые неиспользуемые параметры при вызове шаблонов
  • удалить лишние передаваемые параметры "основа", если в самом шаблоне такого параметра вообще нет + м.б. добавить отсутствующие (важно! не все параметры "основа" обязательны!)
  • шаблон словоизменения: переименовать названия шаблонов, если они являются редиректами
  • поставить ударение, если его нет (как?)
  • лишние пустые строки в шаблонах словоизменения. Пример: шворочка
  • исправить глюки вида: |основа={{PAGENAME}}, пример: Алфимов
  • добавить шаблон "{{морфо}}", если его нет; для рус. существительных это что-то вроде: {{морфо|прист1=|корень1=|суфф1=|оконч=}}
  • сделать отображение шаблонов многострочным, добавить отсутствующие параметры, сделать параметры именованными (!): пример

Раздел "Произношение"[править]

Раздел "Значение"[править]

  • добавлять # перед строками
  • учитывать шаблон "прото": взять
  • добавлять отсутствующий шаблон "пример"
  • замена '''слово''' в примерах на {{выдел|слово}}
  • пометы:
    • пометы не могут быть на отдельной строке [5]
    • добавление языка к пометам
    • замена курсива на пометы
  • применение нового шаблона (или шаблонов) "семантика"
  • ошибки, которые надо исправить вручную: ЧПУ, ...
  • пустые подразделы снабдить двумя пустыми элементами списка
  • удалить ссылки на несуществующие файлы [6]
  • составить список статей с пустыми значениями
  • использовать as_ru
  • "помета." - это устаревшее и нужно это уничтожать

Новая система для семантики[править]

  • преобразование в новую систему
    • учитывать {{прото}}
    • разделять пометы и определение
  • ПОМЕТЫ
  • категории преобразовывать в шаблон {{Категории}} (c языком) из текста "Категория1; Категория2"
  • подготовительный этап:
    • метаграммы, анаграммы вынести в третий уровень перед переводом
    • фонетические варианты перенести в третий уровень
    • варианты написания вынести в третий уровень

Раздел "Перевод"[править]

  • в подразделе "Перевод" подзаголовки убрать и заменить их параметрами в шаблоне "перевод"
  • убрать f и прочее, заменив на {{f}}, пример правки: [7]

Раздел "Этимология"[править]

  • в разделе "Этимология" привести неправильные пустышки "От ??", "Происходит от" к стандартному виду
  • неправильно оформленные примеры: пример
  • исправление символов в этимологиях Фасмера
    • смешение латиницы и кириллицы, пофиксить диакритику
    • сделать ссылки на статьи: латыш. roka «рука» -> латышск. roka «рука»

Внеблоковые[править]

  • добавить {{Cf}} для слов с большой/маленькой буквы (ссылку друг на друга)
  • странные штуки вида {{?|who=TrudoBot|what=ссылки+тип слова}}: долгострой#Библиография
  • шаблоны внизу страницы
    • проверить, чтобы unfinished и прочие шаблоны были с правильным языком секции! (и чтобы их количество было правильным, т.е. одиночным там где надо), пример: абитуриент
    • исправление использования шаблона "длина слова"
  • [[Категория:]] и пр.
    • "[[Категория:]]" всё еще не везде вычищено, пример: локализация, причина: 1 язык и омоформы
    • доп. информация, изначально {{cat|||lang=}} встречался 5491 раз, бот сейчас работает над этим в том числе
  • предложения от Cinemantique [8]:
    • шаблоны в одну строку
    • шаблоны с категорией в одну строку
    • категория с языковым суффиксом, которая должна быть в шаблоне
    • несколько категориальных шаблонов подряд
    • если Категорий вообще нет, то добавить пустышку

Разное[править]

  • зачем оставлять текст статьи при редиректе? [9], это ошибка, отыскать подобные.
  • возможно сделать викификацию или по крайней мере отлавливание ручных таблиц вида: [10]
  • добавить блок ссылок вида "См. также" (вверху) на все остальные страницы
    • идентифицировать подобные блоки на других страницах
  • если пробел в слове - значит это должно быть словосочетание! проверить
  • у словосочетаний этимология должна быть по умолчанию пустой (никаких шаблонов типа "Происходит от") - вычистить

Наполнение[править]

  • создавать шаблоны метаграмм и анаграмм и вставлять их в статьи
  • построить дерево синонимов, гиперонимов и т.п. и попробовать найти недостающие звенья
  • рифмы? как в английском викисловаре
  • доставать недостающую информацию из других ВС
  • переводные статьи можно попробовать формировать на основании других ВС
  • возможно придумать что-нибудь для корней (на основании родственных слов)
  • снова прогнать ВС на предмет новых слов для БД (в ускоренном режиме), пример: адех

Индексы и списки[править]

  • создать индекс слов с произношением
  • формирование индексов слов
  • специальные списки: красные ссылки
  • дополнение существующего обратного индекса слов (и удаление редиректов??)
  • отфильтровать словари, исправить ошибки, в т.ч. красные ссылки, пример: слова "асснере" не существует
  • разбитие на блоки/страницы сделать непрерывным (без ссылок вида "см. аб"), тогда заголовки возможно будут вида "аб..ав | ав..аг | ..."
  • красные ссылки:
    • разбить на "Потенциальные глаголы", "Потенциальные прилагательные" и прочее
    • перенести в "Индекс:"
    • добавить главную описательную страничку
    • добавить предупреждение о том, что редактировать нельзя, сообщайте об ошибках там-то
    • добавить дату обновления индекса

Словоизменение[править]

  • распарсить starling и получить базу данных схем слонения/спряжения

Словоформы[править]

  • формирование словоформ (позже распишу подробнее)
  • примеры статей омоформ-словоформ: души, ...
  • Cinemantique скинул "Словарь омонимичных словоформ" в chm-формате, надо распарсить и использовать!

Произношение[править]

  • доставать информацию из других языковых разделов (например, en:городок)
  • создать индекс слов с произношением

Загрузка внешних данных[править]

  • Яндекс.Словари, украинский
    • пример случая, когда ";" надо расценивать как несколько значений: переклад
    • "арбуз → кавун" есть, а наоборот почему-то нет (арбуз, кавун)
    • пример с многими пометами: железо
    • возможны опечатки (-ий): удивительний
    • в левом блоке краткий перевод есть: зло
  • Словарик, можно распарсить: [11]
  • Lingvo.ua
    • тоже можно распарсить: [12]
    • случай, когда обратного перевода почему-то нет, но можно попытаться достать: автолюбитель

Языки[править]

  • включить в анализ шаблоны "язык по коду (И)"
  • включить в анализ таблички по типу той, что на "Категория:Словенский_язык"
  • включить в анализ категории шаблонов словоизменения (там есть ссылки вида "Русские существительные" и т.п.)

Гаджеты[править]

Goto-top[править]

  • привязаться к высоте и ширине сайд-бара для определения времени и места вставки ссылки "наверх"
  • возможно добавить еще ссылку "вниз" (при этом возможно сделать это опциональным в личных js)
  • возможно переименовать на что-то вроде ScrollPage или как-то так
  • добавить доку

HideEmptyness[править]

  • для пустого раздела "Значение" добавить некоторую текстовочку, например, "Не указано ни одного значения."
  • возможно имеет смысл дублировать этот блок точно также, как и ссылку в гаджете goto-top
  • запоминать состояние раскрытости блока "Скрыть" (только для темы "Векторная")
  • ссылку на доку гаджета рядом с меню "Скрыть"
  • добавить ссылку: "показать всё/скрыть всё"
  • если два шаблона {{пример}} идут рядом (возможно через текст), то что-то глючит: [13]

TabbedLanguages[править]

  • сделать опцию в "Оформление" включать/отключать работу этого гаджета (при этом перезагрузив страницу, конечно)
  • перемещение мешающих информационных табличек в сайд-бар или заголовок

Новые идеи[править]

  • возможность сворачивать заголовки, особенно не хватает на моих страницах :)
    • при этом можно запоминать свёрнутые блоки в localStorage
  • скрывать содержимое статьи (с бегунком загрузки) и показывать только после полной загрузки
    • полезно для других гаджетов, модифицирующих страницу
    • лучше сделать именно в виде отдельного гаджета, чтобы это было опциональным
  • создание статьи с помощью мастера (ответы на вопросы по морфологии, галочки и прочее)
    • возможно лучше использовать наработки по шаблонам-болванкам
  • частотность слова, размещённая иконкой рядом с языковой ссылкой "Править" (Cinemantique, {{freq}})

Разное[править]

  • переспросить про категории шаблонов Категория:Шаблоны:*
  • парсинг текста, лемматизация и доставание ссылок на Викисловарь
  • поиск нового сленга в статьях
  • блок "на других языках"
  • дерево семантических категорий (страницы, начиная с базовых), с перекрёстными ссылками, когда несколько родителей
  • блок "перев-блок" почему-то вначале на некоторых страницах раскрыт, а потом только схлопывается (пример: переходный глагол)