Участник:Vitalik/todo
Мои закладки :: Мой todo-список :: Вклад бота |
Викификация и ошибки[править]
Идеи для автоматически обновляемых отчётов[править]
- Прилагательные
- -[бвдзлмнпрстф]ый : прил ru 1(*)a...
- -[бвдзлмнпрстф]ий : прил ru 2(*)a...
- -[кгх]ий : прил ru 3(*)a...
- -[жчшщ]ий : прил ru 4a...
- -[ц]ый : прил ru 5a
- -еий : прил ru 6a
- -[бвдзлмнпрстф]ой : прил ru 1(*)b...
- -[кгх]ой : прил ru 3b...
- -[жчшщ]ой : прил ru 4b...
- -ечек, -ёчек, -ичек, -очек, -учек, -ашек, -ешек, -ишек, -ошек, -ушек, -ышек -- содержат в индексе звездочку * или градус °
- проверка шаблона "морфо": для начала ни один параметр не должен содержать дефисы, запятые. и вообще обычно это последовательность букв, иногда может быть в квадратных скобках
- искать много согласных подряд (возможно это вандальная правка)
Другие идеи[править]
- Проверять не просто смешение кириллицы и латиницы, а наличие букв не из алфавита
- Добавить механизм исключений сюда: Викисловарь:Отчёты/Ошибки/Содержимое/Ошибки/Ударение_на_согласный
- Проверять на смешение не только заголовки, но и текст статьи
- Ошибки в использовании шаблона {{длина слова}} после того, как будет решено, как с ним быть
- Наличие помет вне раздела значений, а также отсутствие у них указания языка
- Некоторые специфичные моменты на проверку правильности фонетики (произношения)
- Использование неправильных языковых заголовков
- Поиск невидимых символов в заголовках (например, мягкий перенос)
- и вот ещё кандидаты: '\xe2', '\x80', '\x8e'
- Поиск невидимых символов в тексте (например, мягкий перенос)
Заголовки (структура статей)[править]
- структура
- примеры ущербной структуры: load
- исправление уровня
- добавление недостающих
- проверить правильность порядка заголовков, а также отсутствие необходимых
- убрать дублирование заголовков, пример: аллоэтноним
- исправление "неизвестных"
- сортировать заголовки второго уровня по алфавиту
- заголовки второго уровня
- определённые разделы
- избавиться от "Латиница (Latinça)"
- решить что-то метаграммами/анаграммами.. Хорошая правка от Infovarius: [3]
- разные интересные случаи:
- встретил интересный заголовок: "Фонетические и фонологические свойства", пример: инфимум
- раздел "Типичные сочетания", пример: озеро, легализовать или нет?
- подразделы раздела "Производные слова", пример: за-, легализовать или нет?
- Achilla: "Варианты имени", "Дериваты", "Соответствующее мужское имя — ?", "Аналог имени в русском языке — ?"
- разное
- словоформа со слогами как заголовок? примеры: берегу, голова#Сербский
- поубирать пробелы после заголовка (после последнего равно!!)
Раздел "Морфология"[править]
- параметры "соотв" доприводить в порядок
- найти текст, который можно перенести в "соотв" (пример: [4])
- круто! можно распарсить эти страницы и перенести инфу к нам
- доразбираться со "слогами" (плюс идея избавиться от шаблона "по-слогам")
- добавить шаблон "по-слогам", если его нет
- попробовать найти ошибки вида: по-слогам||значение
- особые случаи: крёстная, предыкт, монгольский, واد, commodity, anne, адвентистка, ...
- слогоделение, когда одна буква в слоге, как лучше быть, пример: заика
- удалить пустые неиспользуемые параметры при вызове шаблонов
- удалить лишние передаваемые параметры "основа", если в самом шаблоне такого параметра вообще нет + м.б. добавить отсутствующие (важно! не все параметры "основа" обязательны!)
- шаблон словоизменения: переименовать названия шаблонов, если они являются редиректами
- поставить ударение, если его нет (как?)
- лишние пустые строки в шаблонах словоизменения. Пример: шворочка
- исправить глюки вида:
|основа={{PAGENAME}}
, пример: Алфимов - добавить шаблон "{{морфо}}", если его нет; для рус. существительных это что-то вроде:
{{морфо|прист1=|корень1=|суфф1=|оконч=}}
- сделать отображение шаблонов многострочным, добавить отсутствующие параметры, сделать параметры именованными (!): пример
Раздел "Произношение"[править]
- для глаголов нужен шаблон
{{transcription||}}
, а не{{transcriptions||}}
- автозамена неправильных или неточных символов в транскрипции
- случаи, относительно которых есть вопросы: английский, асфальтироваться, доводить до белого каления, ...
Раздел "Значение"[править]
- добавлять # перед строками
- учитывать шаблон "прото": взять
- добавлять отсутствующий шаблон "пример"
- замена
'''слово'''
в примерах на{{выдел|слово}}
- пометы:
- пометы не могут быть на отдельной строке [5]
- добавление языка к пометам
- замена курсива на пометы
- применение нового шаблона (или шаблонов) "семантика"
- ошибки, которые надо исправить вручную: ЧПУ, ...
- пустые подразделы снабдить двумя пустыми элементами списка
- удалить ссылки на несуществующие файлы [6]
- составить список статей с пустыми значениями
- использовать as_ru
- "помета." - это устаревшее и нужно это уничтожать
Новая система для семантики[править]
- преобразование в новую систему
- учитывать {{прото}}
- разделять пометы и определение
- ПОМЕТЫ
- категории преобразовывать в шаблон {{Категории}} (c языком) из текста "Категория1; Категория2"
- подготовительный этап:
- метаграммы, анаграммы вынести в третий уровень перед переводом
- фонетические варианты перенести в третий уровень
- варианты написания вынести в третий уровень
Раздел "Перевод"[править]
- в подразделе "Перевод" подзаголовки убрать и заменить их параметрами в шаблоне "перевод"
- убрать f и прочее, заменив на {{f}}, пример правки: [7]
Раздел "Этимология"[править]
- в разделе "Этимология" привести неправильные пустышки "От ??", "Происходит от" к стандартному виду
- неправильно оформленные примеры: пример
- исправление символов в этимологиях Фасмера
Внеблоковые[править]
- добавить {{Cf}} для слов с большой/маленькой буквы (ссылку друг на друга)
- странные штуки вида
{{?|who=TrudoBot|what=ссылки+тип слова}}
: долгострой#Библиография - шаблоны внизу страницы
- проверить, чтобы unfinished и прочие шаблоны были с правильным языком секции! (и чтобы их количество было правильным, т.е. одиночным там где надо), пример: абитуриент
- исправление использования шаблона "длина слова"
[[Категория:]]
и пр.- "[[Категория:]]" всё еще не везде вычищено, пример: локализация, причина: 1 язык и омоформы
- доп. информация, изначально
{{cat|||lang=}}
встречался 5491 раз, бот сейчас работает над этим в том числе
- предложения от Cinemantique [8]:
- шаблоны в одну строку
- шаблоны с категорией в одну строку
- категория с языковым суффиксом, которая должна быть в шаблоне
- несколько категориальных шаблонов подряд
- если Категорий вообще нет, то добавить пустышку
Разное[править]
- зачем оставлять текст статьи при редиректе? [9], это ошибка, отыскать подобные.
- возможно сделать викификацию или по крайней мере отлавливание ручных таблиц вида: [10]
- добавить блок ссылок вида "См. также" (вверху) на все остальные страницы
- идентифицировать подобные блоки на других страницах
- если пробел в слове - значит это должно быть словосочетание! проверить
- у словосочетаний этимология должна быть по умолчанию пустой (никаких шаблонов типа "Происходит от") - вычистить
Наполнение[править]
- создавать шаблоны метаграмм и анаграмм и вставлять их в статьи
- построить дерево синонимов, гиперонимов и т.п. и попробовать найти недостающие звенья
- рифмы? как в английском викисловаре
- доставать недостающую информацию из других ВС
- переводные статьи можно попробовать формировать на основании других ВС
- возможно придумать что-нибудь для корней (на основании родственных слов)
- снова прогнать ВС на предмет новых слов для БД (в ускоренном режиме), пример: адех
Индексы и списки[править]
- создать индекс слов с произношением
- формирование индексов слов
- специальные списки: красные ссылки
- дополнение существующего обратного индекса слов (и удаление редиректов??)
- отфильтровать словари, исправить ошибки, в т.ч. красные ссылки, пример: слова "асснере" не существует
- разбитие на блоки/страницы сделать непрерывным (без ссылок вида "см. аб"), тогда заголовки возможно будут вида "аб..ав | ав..аг | ..."
- красные ссылки:
- разбить на "Потенциальные глаголы", "Потенциальные прилагательные" и прочее
- перенести в "Индекс:"
- добавить главную описательную страничку
- добавить предупреждение о том, что редактировать нельзя, сообщайте об ошибках там-то
- добавить дату обновления индекса
Словоизменение[править]
- распарсить starling и получить базу данных схем слонения/спряжения
Словоформы[править]
- формирование словоформ (позже распишу подробнее)
- примеры статей омоформ-словоформ: души, ...
- Cinemantique скинул "Словарь омонимичных словоформ" в chm-формате, надо распарсить и использовать!
Произношение[править]
- доставать информацию из других языковых разделов (например, en:городок)
- создать индекс слов с произношением
Загрузка внешних данных[править]
- Яндекс.Словари, украинский
- Словарик, можно распарсить: [11]
- Lingvo.ua
- тоже можно распарсить: [12]
- случай, когда обратного перевода почему-то нет, но можно попытаться достать: автолюбитель
Языки[править]
- включить в анализ шаблоны "язык по коду (И)"
- включить в анализ таблички по типу той, что на "Категория:Словенский_язык"
- включить в анализ категории шаблонов словоизменения (там есть ссылки вида "Русские существительные" и т.п.)
Гаджеты[править]
Goto-top[править]
- привязаться к высоте и ширине сайд-бара для определения времени и места вставки ссылки "наверх"
- возможно добавить еще ссылку "вниз" (при этом возможно сделать это опциональным в личных js)
- возможно переименовать на что-то вроде ScrollPage или как-то так
- добавить доку
HideEmptyness[править]
- для пустого раздела "Значение" добавить некоторую текстовочку, например, "Не указано ни одного значения."
- возможно имеет смысл дублировать этот блок точно также, как и ссылку в гаджете goto-top
- запоминать состояние раскрытости блока "Скрыть" (только для темы "Векторная")
- ссылку на доку гаджета рядом с меню "Скрыть"
- добавить ссылку: "показать всё/скрыть всё"
- если два шаблона {{пример}} идут рядом (возможно через текст), то что-то глючит: [13]
TabbedLanguages[править]
- сделать опцию в "Оформление" включать/отключать работу этого гаджета (при этом перезагрузив страницу, конечно)
- перемещение мешающих информационных табличек в сайд-бар или заголовок
Новые идеи[править]
- возможность сворачивать заголовки, особенно не хватает на моих страницах :)
- при этом можно запоминать свёрнутые блоки в localStorage
- скрывать содержимое статьи (с бегунком загрузки) и показывать только после полной загрузки
- полезно для других гаджетов, модифицирующих страницу
- лучше сделать именно в виде отдельного гаджета, чтобы это было опциональным
- создание статьи с помощью мастера (ответы на вопросы по морфологии, галочки и прочее)
- возможно лучше использовать наработки по шаблонам-болванкам
- частотность слова, размещённая иконкой рядом с языковой ссылкой "Править" (Cinemantique, {{freq}})
Разное[править]
- переспросить про категории шаблонов Категория:Шаблоны:*
- парсинг текста, лемматизация и доставание ссылок на Викисловарь
- поиск нового сленга в статьях
- блок "на других языках"
- дерево семантических категорий (страницы, начиная с базовых), с перекрёстными ссылками, когда несколько родителей
- блок "перев-блок" почему-то вначале на некоторых страницах раскрыт, а потом только схлопывается (пример: переходный глагол)
Мои закладки :: Мой todo-список :: Вклад бота |