Обсуждение Викисловаря:Проект:Латышский язык

Содержимое страницы недоступно на других языках.
Материал из Викисловаря

Форматирование статей о латышских словах[править]

Здравствуйте Эл, судя по истории правок, вы тот человек, добавивший около 10 тысяч словарных статей латышского языка. Очень хочется поинтересоваться, откуда вы смогли их взять и как можно помочь с этим, потому что очевидно, что это только треть всех слов, которые следует добавить для более-менее полного покрытия общей лексики. Спасибо Soshial 11:57, 25 января 2012 (UTC)[ответить]

Добрый день! К сожалению, о 10 тыс. речи пока нет - есть лишь порядка 2,5 тыс. У меня есть небольшой бумажный латышско-русский/русско-латышский словарь, кроме того, имеется неплохой (с оговорками) [file:///C:/Current/Dict/LV/LV-RU-a.htm сайт] с латышско-русскими переводами. Иногда используются пераллели из английского, польского и других викисловарей. Но даже когда будет 10 тыс., это не треть, а какие-нибудь 5% от того, что в принципе должно быть: язык богат, и мы хотим описать его лексику полно. Помощь - как и всегда тут - может заключаться в грамотном переносе данных из имеющихся словарей; если будут конкретные предложения, я готов объяснить, как сделать правильно. --Al Silonov 12:13, 25 января 2012 (UTC)[ответить]
Есть ли ещё другие пользователи, занимающиеся латышским? У меня несколько словарей латышского, которыми я могу поделиться (в том числе, мультитраном). Кстати, насчёт него: как вы думаете, есть ли возможность переманить людей, дополняющих словарь в мультитране? Можно ли подключить латышско-русский к проекту wiktionary-export, чтобы люди могли пользоваться результатами трудов викилексикографов? Soshial
Кажется, Vesailok делал что-то, были и другие, менее активные ребята, делавшие статьи о латышских и латгальских словах, но - эпизодически. Лично для меня латышский ничем не выделен среди других языков. Со всеми иностранными языками ситуация пока неважная, работа только начинается, так что массовая помощь, в том числе со стороны мультитрановцев, была бы кстати, но при одном условии - соблюдение здешних правил и форматов. Если у кого-то есть электронный двуязычный словарь, где один из языков - русский, то хорошо бы сделать автоматический конвертор и залить преобразованное содержимое ботом (можно привлечь кого-нибудь из ботовладельцев), такие случаи были, хотя и не всегда успешные. Пока же я работаю практически вручную, на уровне отдельных статей. Менее производительно, но сравнительно надёжно, как хочется верить ;) --Al Silonov 13:47, 25 января 2012 (UTC)[ответить]
Неужели возможно просто взять словарь под копирайтом, импортировать и залить ботами всю информацию? Если да, то я бы попросил контакты ботовладельцев :) — Soshial 14:57, 25 января 2012 (UTC)[ответить]
Всю информацию не надо, надо - то, что подходит нам (цитаты, например, надо подбирать тут самостоятельно). А так - Don Rumata, Infovarius имеют ботов и, кажется, активны сейчас. VPliousnine тоже мог бы, но он малоактивен, еще был TrudoBot, который много чего заливал, но тоже сейчас заглох. В любом случае необходимо тщательно настраивать бот, отфильтровывая ненужное, корректно оформляя значения и т. п. --Al Silonov 15:19, 25 января 2012 (UTC)[ответить]
Эл, у меня бота пока нет, но я интересуюсь как его можно завести. По латышскому языку есть отличный Латвийско-русский словарь с объяснением слов и Латышско-русский, русско-латышский словарь. Don Rumata 17:41, 25 января 2012 (UTC)[ответить]
Итак, давайте подведём итоги: у нас есть два ваших словаря, два моих (с обширными синонимами) и ещё Мультитран. Давайте найдём ботов с ботовладельцами и решим, как будем импортировать слова. Если всё придёт в готовую стадию, то я смогу привлечь латышей к помощи в написании и обработке залитых статей. Очень большое желание всё-таки создать хотя бы один полный словарь тут, кроме русского. Offtop: если фразеологизмы и устойчивые выражения нужно указывать в конце статьи, то в каком месте нужно указывать примеры употребления значений слов — это ведь важная часть словаря. Спасибо. И где можно вести подобные координирующие обсуждения? — Soshial 09:37, 27 января 2012 (UTC)[ответить]
См. Викисловарь:Проект:Латышский язык или так:ВС:П:lv. --Vesailok 23:50, 27 января 2012 (UTC)[ответить]
Спасибо огромное. Страничку дополнил: Vesailok и Al Silonov, записывайтесь если хотите участвовать. Пожалуйста, дайте контакт ботовладельцев! Код преобразования словарей в wiki я доработаю, мне всего лишь нужно знать, как заливать их в викисловарь! Soshial 11:19, 28 января 2012 (UTC)[ответить]

Я сделал шаблон {{сущ lv}} универсальным. Теперь он поддерживает все виды склонения. Можно создать кучу частных шаблонов по образу {{сущ lv f -a}} и {{сущ lv m -a}}. Мне кажется, что такие названия проще и понятнее чем ныне существующие {{сущ lv f4}}, {{сущ lv m1}}. Я только не придумал как Pluralia tantum называть (может как в немецких?) и нужны ли для них отдельные шаблоны. Да, хотел заметить, что в старых шаблонах всегда показывался звательный падеж, однако в латышском языке он существует только у существительных (как собственных, так и нарицательных) обозначающих лиц. Категории одушевлённости в латышском языке нет. Во II, V и VI склонении может быть чередование согласных. Есть небольшая группа существительных на -s склоняющихся особым образом близким ко II склонению. Возможно из-за этого придётся оставить индекс склонения в названии шаблона или использовать для них {{сущ lv}} с параметрами. Don Rumata 05:05, 26 января 2012 (UTC)[ответить]

Можно мне вступить в дискуссию на пару слов? Я понимаю, что обращение человека к столу может расцениваться как легкая стадия помешательства. Однако, язык это позволяет. См., например, таблицу склонения для слова galds в латышском Викисловаре: [[1]]. --Vesailok 06:08, 26 января 2012 (UTC)[ответить]
Что касается звательного падежа в латышском языке, то тут не всё так просто. В сущестующих шаблонах звательный падеж просто дублирует именительный, и в большинстве случаев это так, но не во всех. Так для существительных I склонения иногда окончание отбрасывается (direktors — V. direktor!). для существительных II склонения в большинстве случаев имеет окончание -i (Jānis — V. Jāni!), но иногда отбрасывается (Pēteris — V. Pēter!), а у слов на -s в звательном падеже окончания нет (akmens — V. akmen!) или совпадает с именительным (suns — V. suns!) как у большинства слов IV и V склонения. В III склонении звательный падеж имеет окончание -u (Mikus — V. Miku). Иногда в IV склонении есть параллельные формы (sieva — V. sieva! или siev!). Да, звательный падеж есть у всех существительных, но обычно употребляется только для существительных обозначающих лиц. И так как есть масса исключений именно для этого падежа, то лучше его задавать отдельным параметром. Хотя я тоже на этом не настаиваю. Don Rumata 13:33, 26 января 2012 (UTC)[ответить]
Эх, Румата, Румата... Я долго экспериментировал с разными вариантами универсальности для разных языков и убедился на практике, что множество простых шаблонов лучше/гибче/удобнее, чем один универсальный. Я специально добился того, что для каждого языка имеется один шаблон самого общего вида, не указывающий никаких параметров типа "род, склонение", и все тонкости добавляются не с помощью параметров, а с помощью суффиксов в имени шаблона. В шаблоне типа сущ ХХ никогда не изображается таблица. Помимо всего прочего этот вариант лучше всего работает с шаблонами создания статей: там параметров для универсального шаблона не напасешься, а индекс подставить - легко и приятно. Надо бы откатить эту универсальность. --Al Silonov 07:32, 26 января 2012 (UTC)[ответить]
По мне так строка {{сущ ru f ina 2*a-ня|основа=пе́сн|основа1=пе́сен|слоги={{по-слогам|пе́с|ня}}}} и {{сущ ru|f|ina|2*a-ня|основа=пе́сн|основа1=пе́сен|слоги={{по-слогам|пе́с|ня}}}} принципиально ничем не отличается, кроме использования пробелов вместо вертикальной черты. Я бы её ещё упростил разделяя основы косой чертой {{сущ ru|f|ina|2*a-ня|пе́сн/пе́сен|слоги={{по-слогам|пе́с|ня}}}}. Возможно для русского языка, где много вариантов чередования и ударения, указывать словоизменение в отдельных шаблонах и проще и удобнее. Но и в существующей системе шаблонов словоизменений для русского языка тоже есть минусы. Главный из них в том, что нельзя получить форму слова для конкретного падежа. Содержимое параметров основа, основа1, основа2, основа3 весьма неконкретно, поэтому трудно догадаться что именно в них указывать, особенно когда их больше двух. В некоторых шаблонах использование этих параметров весьма нелогично, особенно это касается шаблонов спряжений глаголов. Возможно это просто несогласованность в подходе разных участников их создававших. В прочем, в латышском языке всё намного проще, и если вы настаиваете убрать таблицу падежей из шаблона {{сущ lv}}, я уберу или вы можете сами откатить мои изменения. Don Rumata 13:00, 26 января 2012 (UTC)[ответить]
Не будем смешивать две проблемы. Недостатки русских шаблонов со временем, бог даст, исправим; я делал попытки решить именно эту проблему (сохранились обломки - шаблоны для "внутреннего применения" типа {{Сущ-Состав}}, {{основа-m}}, {{окончание-m}}), но не сумел завершить (а если бы завершил, то мы могли бы формировать таблицы словоизменений для слов типа женщина-врач, массовик-затейник). Но сейчас речь о другом - "один сложный универсальный vs много простых специальных". Можешь мне поверить, я очень много экспериментировал с обоими вариантами, изначально отдавая предпочтение именно сложной универсальности (этот вариант действительно имеет ряд преимуществ). Но практика показала, что альтернативный вариант лучше - универсальные шаблоны с числом признаковых параметров больше трех быстро становятся нечитаемыми и неуправляемыми. Очень часто возникают ситуации, когда сложность такого шаблона становится очень неприятным препятствием для работы, и преимущества такого варианта оказываются подавлены его недостаточной гибкостью. Для меня же при нынешнем состоянии нашей технологической базы есть еще один ключевой довод: при (полу)автоматическом создании статей с использованием шаблонов из серии {{NEW}}/{{NEW ru}} и т. п. указать индекс просто, а параметры - нет. Мне, как самому плодовитому создателю статей (в том числе о латышских словах) это важно. То же самое касается ботов, создающих статьи. Поэтому я и зарезервировал для каждого языка по два-три уровня шаблонов в зависимости от степени деталировки (просто "сущ", "сущ ХХ" и "сущ ХХ YY"). Это дает гибкую возможность инкрементно наращивать деталировку, указывая только те параметры, которые действительно нужны в конкретном детальном шаблоне. --Al Silonov 17:23, 26 января 2012 (UTC)[ответить]
 Сделано. Откатил все свои изменения. Don Rumata 16:32, 28 января 2012 (UTC)[ответить]

Заливка статей[править]

Если у кого-то есть электронный словарь и желание импортировать его сюда, пусть даст ссылку? чтобы все посмотрели, - тогда будем говорить, что и как делать! По поводу ботов - их искать здесь --Al Silonov 13:00, 28 января 2012 (UTC)[ответить]

Хорошая идея. С ботами ни разу пока не работал, но со словарями... вот все словари, которые есть у нас в наличии:
  1. lv-ru/ru-lv tilde http://dl.dropbox.com/u/4270160/Lv-Ru_Tilde.rar (много синонимов)
  2. lv-ru/ru-lv may du v01 http://dl.dropbox.com/u/4270160/lav_rus_may_du_v01.rar простой
  3. http://www.liis.lv/latval/vardnica/ около 15 тысяч (но есть много значений, их употреблений и фразеологизмов)
  4. Multitran http://www.multitran.ru/c/m.exe?a=112&l1=27&l2=L2_value 100 тыс (много мусора, но зато есть примеры использования и фразеологизмы)
  5. Liesma 1980 http://rutracker.org/forum/viewtopic.php?t=3437879 53 тыс
  6. Abots 1990 http://skazki.eclub.lv/latruslov.htm либо http://vardnica.virtualis.lv/ 15 тыс (gvozdev@inbox.lv)
Ночью не сплю - жду вашей реакции. Список ботов посмотрел, но кто из них уже массово заливал сюда - так не разобрался. Soshial 21:06, 30 января 2012 (UTC)[ответить]
Заливали, если не ошибаюсь, - Участник:LXbot, Участник:TrudoBot, Участник:RoggBot. Все они сейчас не активны. Владелец RoggBot - добрый малый, но работает неаккуратно. В любом случае им надо давать очень четкий алгоритм импортирования. Для приведенных словарей это в первую очередь означает грамотный парсер: вся информация должна быть аккуратно разнесена по полям (зонам) словарной статьи? многое надо просто выкидывать. Когда такой алгоритм будет построен, на его выходе надо задействовать механизм подстановки шаблонов генерации статей. Использовать рекомендую шаблон {{NEW}}, для латышских слов будет как-то так (например, для слова labklājība):
{{subst:NEW|lang=lv|cat=|сущ=|гл=|прил=|этим=|син=|ант=|гипер=|trans=|тип=сущ|индекс=|пример1=|перевод=|помета=помета.|слоги={{по-слогам|{{subst:PAGENAME}}}}|основа=labklājīb|[[благополучие]], [[благосостояние]]}}
Или для слова laupīt (там более одного значения):
{{subst:NEW|lang=lv|cat=|сущ=|гл=|прил=|этим=|син=|ант=|гипер=|trans=|тип=сущ|индекс=|пример1=|перевод=|помета=помета.|слоги={{по-слогам|laupīt}}|основа=laup|[[грабить]], [[разбойничать]], [[похищать]] {{пример|}}
# [[лишить]], [[лишать]] (чего-либо) }}
В любом случае это будет грубая первичная работа, требующая ручной доработки (например, у глагола у нас основной вид - несовершенный, то есть "лишить, лишать" надо будет переделывать на "лишать (лишать)" и т. п. --Al Silonov 22:43, 30 января 2012 (UTC)[ответить]


Singularia tantum, pluralia tantum[править]

Есть и другая проблема: есть слова только с единственным/множественным числом (например, maize sg. или brokastis pl). Как такие статьи обрабатывать в шаблоне? Soshial 17:02, 31 января 2012 (UTC)[ответить]

Во-первых, желательно убедиться, что слово в силу морфологических особенностей действительно не может иметь одну из двух категорий числа. С maize у меня есть сомнения - встречаются формы типа maizēm, разве это не то же слово? При этом нас не должно волновать, что семантически значение мн. числа здесь будет выглядеть странно, в этом разделе описывается морфология, а не словоупотребление. Для случаев, где действительно морфология позволяет образовывать формы только ед. ч. или только мн. ч., надо добавлять в тело уже существующего шаблона проверку параметров st и pt (см., например, Шаблон:сущ lv f6), чтобы можно было при вызове шаблона указать |st=1 (отключить мн. ч.) или |pt=1 (отключить ед. ч.). Если есть желающие - вперед. Лично я, честно говоря, не готов записываться в участники проекта по латышскому языку - просто нет физической возможности (если бы была, я бы прежде занялся украинским, белорусским, чешским, - там я смог бы более компетентно работать). --Al Silonov (обсуждение) 07:54, 2 апреля 2012 (UTC)[ответить]
Кстати, в латвийском разделе Викисловаря это реализовано, я попытаюсь это реализовать. Но сейчас есть более важная задача: доделать Шаблон склонений. Я очень плохо разбираюсь в эзотерических шаблонах, а у вас это займёт едва одну минуту. Я создал Шаблон:сущ lv f1 и Шаблон:сущ lv f3, а вот поправить Шаблон:сущ lv f2 (который сейчас редиректит на другой шаблон) у меня не хватает умений. Очень-очень прошу помочь — у вас много времени не займёт, потому что грамматика в латышском простейшая. Soshial (обсуждение) 08:46, 30 мая 2012 (UTC)[ответить]

Категории[править]

Просьба переименовать статью Категория:Национальность/lv, чтобы она была названа по аналогии с этими категориям. PS. Почему на Википедии я могу переименовывать статьи, а в Викисловаре — нет? Спасибо. — soshial@ 00:05, 28 мая 2013 (UTC)[ответить]