Конкорданс:Русскоязычная Википедия/20080220

Материал из Викисловаря

Информация[править]

Список построен с учётом словоформ. Подробности и аналогичный список для Википедии на английском упрощённом языке см. [1] .

Убраны внутренние ссылки для:

  • знаков вики-разметки: tr, td, ref, jpg, blockquote, div
  • кодов стран: de, ru
  • частей слов: Санкт-, Нью-

По умолчанию Lemmatizer преобразует все распознанные слова в ВЕРХНИЙ РЕГИСТР. Поэтому автоматически были преобразованы к нижнему регистру слова, имеющие длину больше одной буквы и и имеющие вторую букву в слове зАглавную.

Вручную были исправлены в списке имена собственные (написаны с прописной, или все заглавные):

  • имена: петр, федор, николай, александра, михаил, алексей, андрей, юрий, джон, борис, дмитрий, мария, константин
  • города: москва, спб, петербург, котор, париж, рим
  • страны: россия, ссср, германия, сша, англия, польша, италия, франция, великобритания, америка, китай, австрия, япония, рф
  • аббревиатуры: http, isbn, www, ngc

К нижнему регистру приведены: См

1000 наиболее частотных слов (на 20 февраля 2008 года)[править]

Лемма Число документов Частота в корпусе
в 208526 2630654
и 167286 1781831
на 144886 825127
с 131464 698571
год 102000 465278
быть 96090 435391
по 102807 355260
из 94677 293811
не 73878 292548
он 68099 275703
к 79768 268649
который 81328 258611
а 77684 247315
что 59215 230098
этот 73214 215457
от 78200 213868
как 71325 205170
г 48524 185726
также 91364 169269
о 54634 151273
они 51472 149087
до 58168 148679
за 55179 146200
один 61766 135511
или 48595 135215
время 57439 133699
город 43395 121880
для 50950 119595
ссылка 113539 118493
длить 50784 118407
но 45879 115380
свой 46282 114294
другой 57582 112309
м 37145 111251
это 47787 110863
она 38620 107847
оно 46792 107012
тот 43315 103965
первый 48330 100020
человек 41672 97264
во 46898 96350
у 40775 94619
math 3366 90478
The 25684 89758
район 37029 88607
являться 43476 86889
стать 40775 85467
все 38354 81750
же 37493 78149
так 37526 77631
иметь 38550 76099
Россия 31615 75993
под 39710 75662
см 62120 75607
его 36865 74025
история 42925 73203
два 38479 71910
группа 25824 71786
область 31280 70572
после 37628 70064
такой 32687 69152
новый 36366 69082
язык 21258 68027
весь 35032 67766
официальный 43986 66441
война 25613 65895
мочь 28454 63777
часть 32166 63106
система 22398 62878
место 32237 61964
фильм 17460 61451
состав 40679 61409
только 30881 60320
работа 28980 59055
население 37366 58854
н 22419 57126
of 17208 57096
российский 25403 56036
русский 25677 56001
сайт 35148 55312
получить 32905 55064
вид 27137 54972
много 31767 54884
км 32671 54487
число 32956 54292
себя 30985 54178
переть 29174 53341
имя 28227 52905
свое 28722 52720
большой 30565 52422
название 30894 52387
известный 35390 51991
игра 12746 51771
однако 27177 51659
где 30314 51321
самый 29504 51293
страна 22725 51143
со 30835 50948
ref 6114 50543
td 488 50467
при 28066 49869
земля 31038 49822
a 18540 49764
i 19055 49718
несколько 30338 49508
жизнь 24982 49201
общий 28746 49129
между 26679 47986
т 26356 47453
входить 43156 47410
находиться 28533 47115
когда 25461 45954
советский 20264 45603
посол 27615 45250
Москва 19308 45093
центр 24736 44540
государственный 19417 44183
начало 27637 44012
я 14054 43977
СССР 17355 42883
быль 22818 42360
конец 24970 42101
было 23186 42032
то 22528 41679
книга 18332 41616
еще 23401 40387
США 17734 40265
д 18253 40264
small 13561 39723
сам 23245 39614
последний 24776 39600
их 22820 39484
sub 2551 39321
через 23137 38821
армия 12460 38735
площадь 28353 38283
х 21757 38162
работать 23777 37633
территория 17452 37584
чтобы 18948 36919
е 19171 36443
школа 16913 36388
сторона 18886 35879
й 10728 35808
день 18417 35340
ее 20669 35183
x 8112 35025
использовать 19633 34928
университет 15328 34900
военный 15013 34706
литература 23888 34596
река 16332 34504
остров 9837 34477
если 16122 34445
около 20997 34417
п 17345 34281
можно 19064 34011
войско 11018 33979
результат 19874 33804
член 17108 33693
управление 19922 33629
сын 16239 33627
слово 16338 33565
образ 20185 33293
пря 21277 32978
главный 21945 32905
церковь 10867 32813
компания 12543 32460
расположить 21357 32170
более 21096 32020
век 17577 31956
ii 14085 31951
например 17691 31918
использоваться 18105 31572
список 23616 31549
московский 14837 31495
каждый 17230 31492
форма 16139 31445
первое 21402 31269
король 8871 31257
январь 17433 31213
октябрь 17296 31040
затем 21296 30836
том 20261 30689
альбом 6693 30365
декабрь 16732 30252
станция 9676 30220
создать 19591 30128
род 17832 30074
занимать 26591 29966
наука 13728 29946
существовать 19196 29921
против 15106 29872
мир 17818 29867
начать 19920 29740
современный 18713 29711
поселок 20119 29683
улица 8400 29544
сентябрь 16370 29539
власть 13340 29507
сила 13887 29237
ребенок 17847 29213
действие 14816 28964
институт 13128 28951
второй 20010 28950
больший 19355 28864
период 16133 28846
развитие 15191 28785
изображение 8979 28774
родиться 24960 28693
миро 17508 28620
совет 12655 28579
американский 15281 28403
name 5975 28397
качество 18522 28353
некоторый 18995 28331
Николай 11523 28205
июль 16218 28204
ноябрь 15970 28163
партия 8816 28039
дом 13183 27981
различный 18451 27936
and 10932 27932
основный 20011 27906
связь 16469 27898
поздний 19013 27850
ряд 18546 27716
лет 19876 27714
дать 18897 27556
смерть 15326 27487
апрель 15823 27435
основной 19613 27412
Александр 12810 27406
э 9880 27404
тип 14404 27380
гг 14175 27372
июнь 15640 27343
автор 18177 27312
веко 16130 27279
c 12625 27261
случай 15028 27161
очень 16096 27113
р 11213 27025
называть 18093 26996
над 17206 26899
организация 12991 26864
команда 9175 26738
без 17397 26684
северный 14753 26656
Иван 11172 26418
вместе 18545 26393
Владимир 11389 26338
государство 11152 26275
лучший 12839 26251
национальный 15040 26231
об 16591 26180
среди 18171 26123
основать 19561 26036
проект 12067 25990
отношение 14168 25931
данный 16304 25806
раз 16000 25764
президент 9194 25747
международный 13170 25641
In 11774 25535
составлять 16156 25370
следовать 16748 25357
чело 19720 25342
новое 17944 25222
помощь 15550 25218
количество 14865 25203
февраль 14448 25140
источник 18268 24921
южный 13728 24920
образование 14264 24861
страница 22333 24831
деятельность 14434 24758
немецкий 12308 24554
три 17123 24474
союз 12261 24369
движение 11984 24365
л 11604 24219
линия 10595 24212
наиболее 17249 24164
кроме 16906 24123
песня 8417 24117
друг 11700 24085
объект 13928 24021
культура 12880 23974
французский 12394 23887
высокий 15236 23832
республика 9272 23707
sup 4305 23558
даже 14388 23532
лишь 14771 23482
участие 15256 23446
принять 15438 23411
федеральный 18639 23351
семья 15039 23321
состоять 16488 23289
гмина 3314 23146
серия 9669 23119
того 16131 23064
английский 12882 23042
процесс 11859 23012
общество 11426 22994
завод 8356 22959
великий 13660 22945
городской 13113 22935
уровень 11437 22904
орден 7665 22895
путь 13692 22890
s 10407 22578
политический 11352 22506
производство 10677 22371
есть 14568 22359
мы 9374 22338
дело 12888 22244
n 6092 22187
административный 17225 22183
театр 7415 22135
программа 9795 22089
народ 10501 21883
правительство 9216 21875
версия 10018 21861
тыс 10199 21848
значение 12882 21782
роман 9080 21747
биография 17755 21729
может 13463 21678
клуб 7599 21578
jpg 5381 21473
вопрос 11148 21418
основа 14173 21418
крупный 14043 21346
деть 12884 21339
западный 12287 21339
построить 12565 21314
полный 15186 21259
украина 8002 21218
отец 12587 21208
статья 13038 21088
представлять 15333 20939
премия 9636 20900
создание 13354 20816
p 5971 20709
журнал 10798 20704
народный 11038 20615
возможность 12287 20460
др 13421 20397
де 6647 20365
мировой 12902 20359
глава 11535 20337
всего 14783 20249
течение 13058 20234
академия 10352 20197
теория 7490 20134
сельский 11931 20071
средний 12858 20035
правый 11347 19909
из-за 13663 19908
искусство 10480 19907
решение 11076 19896
европа 12115 19881
выйти 13242 19873
право 10032 19836
научный 9558 19781
участвовать 13425 19765
исследование 10068 19668
центральный 12855 19662
происходить 13918 19612
сделать 13209 19603
писатель 10357 19592
каталог 9990 19540
большинство 12958 19481
разный 13676 19469
восточный 11903 19457
закон 8207 19430
de 6952 19318
музыка 8892 19272
роль 11878 19236
тело 8396 19229
обычный 12523 19144
сергей 8550 19132
хотеть 12719 19047
здесь 12051 19038
музей 7789 19036
бы 10172 19008
условие 11957 18984
некоторые 13593 18943
федерация 6110 18906
Германия 14577 18884
русская 10238 18858
сюжет 15198 18830
написать 12422 18828
значительный 12633 18827
б 9709 18721
степень 10701 18703
событие 13279 18697
использование 11308 18599
произведение 10975 18569
роля 11481 18516
d 7371 18485
состояние 10792 18469
брат 10143 18315
b 6478 18250
информация 10898 18171
тема 12462 18136
исторический 11231 18083
цель 11968 18076
лицо 10388 18071
играть 11010 18070
перед 12466 18032
тома 13405 18032
момент 12071 17958
ни 9369 17940
считаться 13213 17923
Петербург 9308 17859
m 6338 17857
труд 10843 17808
жить 12424 17761
функция 6998 17668
точка 9084 17520
бой 6413 17510
черный 9573 17380
здание 7454 17372
считать 11536 17333
элемент 8848 17323
iii 8670 17294
князь 6087 17283
высший 10837 17275
класс 8921 17272
представитель 10728 17265
материал 10267 17257
округ 12185 17101
называться 12110 17091
включать 12674 17065
Санкт- 9105 17030
проблема 9570 17027
длина 10064 16958
служба 9466 16948
многий 12796 16868
храм 5473 16863
средство 9999 16859
император 6613 16843
v 7403 16784
небольшой 12476 16746
Александра 9218 16695
внешний 11561 16688
строительство 8147 16673
корабль 5216 16656
текст 8647 16655
факт 14369 16643
появиться 11554 16587
отдельный 11381 16574
тысяча 9476 16556
впервые 12808 16512
житель 10302 16481
собственный 11752 16480
август 10660 16425
режиссер 8392 16371
говорить 9734 16348
проходить 12061 16301
f 4579 16276
сильный 10914 16199
августа 10545 16183
наш 9045 16165
игрок 4263 16103
империя 7668 16068
участник 10307 16058
относиться 11889 16054
рука 9212 15930
иногда 11066 15912
победа 8125 15901
положение 10093 15882
открыть 11446 15825
чемпионат 5505 15817
граница 9852 15805
позволять 9893 15790
влияние 9901 15778
тогда 10835 15766
перевод 8693 15760
частый 11287 15728
поэтому 11155 15710
музыкальный 8447 15705
направление 9600 15705
специальный 10640 15697
выпустить 9199 15689
деревня 7274 15688
начинать 11286 15633
принимать 11816 15599
e 6558 15598
председатель 6908 15587
становиться 10833 15545
го 7499 15474
провести 10715 15428
художник 8285 15397
там 11096 15263
настоящий 12128 15256
местный 9602 15242
выступать 10983 15231
широкий 11517 15214
четыре 10978 15139
многие 11706 15107
ход 9106 15054
май 10352 15040
василий 6890 15037
частить 10911 15018
рабочий 7724 15017
март 10196 15010
внутренний 9475 15004
высота 8503 14995
золотой 9038 14989
HTTP 7135 14989
третий 10909 14983
корпус 5667 14975
ф 7888 14964
заниматься 11431 14963
Михаил 7897 14959
бог 5679 14955
монастырь 4897 14886
газета 7626 14885
герой 8291 14874
references 14572 14815
нижний 9849 14804
борьба 8733 14754
марта 9941 14689
германий 11052 14686
министр 5937 14653
главное 11368 14591
звезда 7079 14545
женщина 8003 14541
вести 10952 14530
ранний 10415 14526
оставаться 10947 14512
начаться 9821 14481
издание 8363 14466
должный 9351 14435
center 2365 14435
самолет 3759 14425
цвет 7476 14421
поэт 7026 14407
Алексей 7008 14343
факультет 6610 14326
размер 8664 14325
должен 9208 14324
временить 10590 14308
красный 8812 14307
сезон 5571 14307
привести 10060 14296
Андрей 6987 14265
назначить 7871 14235
генерал 5319 14194
умереть 10395 14165
экономический 6900 14159
множество 8897 14151
чем 10531 14121
модель 6179 14107
найти 9872 14085
дорога 8210 14079
общественный 8346 14067
экономика 8585 14066
именно 10098 14016
мая 9664 13993
малый 9507 13979
оригинальный 12345 13969
край 7910 13962
содержать 9309 13951
памятник 7146 13933
изменение 8263 13921
мм 4328 13883
актер 6385 13882
уж 10257 13862
карта 6767 13854
r 4841 13849
орган 6984 13811
причина 9345 13802
восток 9201 13802
примечание 13344 13801
идти 9672 13791
остаться 10109 13788
профессор 8512 13786
особый 9822 13756
дочь 8134 13735
предприятие 7199 13724
tr 561 13701
стиль 7560 13693
принадлежать 10487 13684
l 5921 13674
Петр 7100 13632
жена 8436 13588
скорость 6122 13550
сеть 6119 13539
белый 8247 13535
операция 5987 13532
править 9248 13508
план 8108 13482
код 11267 13481
поселение 6487 13467
пункт 8173 13455
старый 9394 13448
to 6644 13447
единственный 10594 13445
постоянный 9478 13396
римский 6135 13361
оба 9525 13290
уже 9979 13207
установить 9298 13205
t 4561 13182
интересный 12345 13167
отличие 9667 13163
павел 6664 13154
руководство 9230 13142
мало 9739 13120
иметься 9347 13111
морской 6371 13106
любой 8891 13046
несмотря 9621 13044
происхождение 9707 13043
художественный 8952 13038
применение 7673 13037
получать 9157 13019
обозначение 10951 13018
Англия 5814 13006
ум 3596 12987
древний 8170 12945
устройство 6716 12927
ISBN 5907 12917
назвать 10301 12915
штат 6531 12912
следующий 10254 12866
поддержка 7656 12838
собор 4467 12816
верхний 8649 12788
важный 9537 12748
север 8379 12733
европейский 8238 12727
матч 3888 12721
xix 8330 12690
втора 10025 12662
деятель 9586 12642
оружие 5585 12584
Польша 8067 12563
царь 5253 12551
ученый 7730 12548
либо 6521 12545
blockquote 3320 12543
окончить 10745 12541
нет 8920 12538
запись 6131 12503
описание 8999 12491
железный 6751 12488
оказаться 8650 12465
вернуться 9229 12464
идея 7439 12453
образовать 9377 12441
давать 8979 12416
масса 6335 12412
div 3354 12376
кто 7822 12340
структура 7565 12338
память 6926 12329
юг 8185 12324
технический 8344 12323
узкий 9572 12323
Юрий 5726 12310
посвятить 9357 12297
противник 5170 12290
задача 6734 12221
вскоре 8972 12217
взять 8589 12164
отличаться 9333 12146
активный 8763 12133
фронт 4134 12119
занять 8261 12119
Джон 6195 12114
суд 5945 12101
озеро 4975 12088
персонаж 5630 12048
термин 7274 12028
писать 8179 12015
Италия 6587 12007
гражданский 7146 11992
встречаться 8438 11983
редакция 10751 11966
действовать 8469 11964
войти 8976 11964
определить 8719 11964
порядок 7685 11951
столица 7134 11941
служить 9303 11903
простой 8295 11872
отряд 5385 11862
битва 5727 11849
ru 6358 11845
мост 3989 11833
месяц 8065 11814
берег 7731 11812
млн 5304 11810
вода 6933 11778
литературный 6184 11766
директор 7193 11757
виктор 5732 11756
единица 7908 11720
полностью 9080 11661
чемпион 4640 11649
делать 8390 11636
счет 7226 11633
частность 9098 11627
Париж 6500 11625
святой 5815 11605
пора 8825 11572
регион 6638 11559
успех 7803 11550
социальный 5999 11536
любовь 6529 11460
видеть 7731 11444
возможный 8472 11441
польский 5066 11421
британский 6248 11403
свободный 7360 11382
Франция 6872 11352
половина 8340 11330
принцип 6686 11323
технология 5783 11308
защита 6867 11296
Борис 5818 11290
канал 5106 11272
зона 5826 11260
представить 8191 11241
настоящее 9398 11161
Дмитрий 5632 11157
должность 6487 11127
k 3347 11105
обладать 7892 11067
разработка 6528 11066
позиция 7079 11049
особенность 8179 11045
возраст 7566 11030
середина 8436 11023
тяжелый 6877 11018
часто 8470 11008
крупнейший 8184 11003
номер 6193 10999
молодой 9271 10990
произойти 8188 10987
комитет 5517 10974
провинция 5779 10974
основание 7869 10964
распространить 8405 10943
выход 7139 10915
звание 6187 10897
революция 6225 10892
картина 5517 10880
сборник 6055 10876
тереть 8717 10860
железнодорожный 6550 10828
кода 9142 10820
село 5821 10793
популярный 8203 10790
медаль 5283 10790
община 5812 10757
поскольку 7595 10751
Великобритания 6235 10749
начальник 5381 10733
метод 5619 10731
характер 7243 10724
фамилия 7749 10717
награда 7784 10705
составить 7856 10698
хотя 8108 10693
творчество 6839 10674
пример 7450 10670
св 4814 10661
ю 6435 10655
стих 4044 10654
g 4601 10632
знак 5624 10632
h 4094 10624
библиотека 6157 10600
губерния 5164 10587
дивизия 2444 10548
округа 8372 10548
знаменитый 8300 10543
комплекс 5798 10531
мнение 6764 10524
доктор 6490 10511
связать 8464 10502
тьма 7995 10497
iv 5890 10492
пытаться 7186 10478
необходимый 7340 10473
промышленность 5935 10472
выбор 6148 10467
Америка 6485 10467
двигатель 3128 10462
пять 8059 10455
отечественный 7099 10439
носить 7924 10424
вновь 7590 10414
способ 6842 10404
температура 4658 10395
быстрый 7466 10391
впоследствии 8233 10376
вещество 4502 10367
открытый 7739 10351
левый 6383 10328
франций 6586 10323
align 764 10304
честь 8048 10298
состояться 7458 10297
продолжать 7830 10291
украинский 4456 10283
пройти 7737 10275
православный 4501 10269
обычно 7614 10264
статус 7253 10236
решить 7384 10235
поверхность 5203 10219
фотография 7932 10213
разработать 7498 10205
знать 6932 10201
всегда 7453 10196
кино 5037 10167
режим 5203 10143
учиться 8495 10134
рождение 6670 10115
запад 7232 10112
флот 4153 10110
энергия 4226 10094
граф 3648 10081
xx 7293 10078
участок 5501 10073
созвездие 8986 10056
письмо 5084 10039
дорогой 6498 10031
выпуск 5432 10023
море 6291 10015
курс 6314 9910
j 3867 9897
пространство 5000 9890
свойство 5821 9885
эпоха 6302 9852
композитор 5905 9839
среда 5754 9828
связанный 7948 9820
боевой 5088 9815
попытка 6922 9814
поражение 5525 9802
семейство 5578 9791
транспорт 6236 9774
появляться 6578 9753
символ 4893 9741
дальнейший 7761 9738
собрание 5404 9737
природа 6100 9734
сочинение 5835 9707
ч 4820 9705
right 3205 9689
вызвать 7002 9675
физический 5897 9665
иной 6677 9664
лидер 6130 9653
ныне 7432 9648
передача 5332 9622
опубликовать 6810 9614
договор 4338 9612
рост 6478 9593
Китай 4754 9582
заместитель 4560 9573
вес 5600 9567
gallery 4375 9566
компьютерный 4526 9564
титул 4281 9513
крепость 4066 9498
Австрия 5423 9493
руководитель 6318 9492
style 2898 9467
старший 6525 9460
живой 6484 9446
философия 4026 9431
кубок 3359 9431
la 4521 9428
сериал 3115 9416
Мария 5023 9413
свобода 5386 9409
Япония 4988 9401
WWW 5225 9392
птица 3975 9390
хозяйство 5394 9390
выходить 6861 9382
предмет 5426 9371
подчиняться 9104 9355
пост 5480 9339
дополнительный 6629 9336
Нью- 5386 9314
хороший 7149 9309
огромный 6973 9306
содержание 6276 9306
NGC 8072 9296
эпизод 3292 9285
поход 4765 9265
перейти 7077 9263
окончание 7471 9260
сталь 6899 9240
ранее 7533 9237
итальянский 5605 9223
еврейский 3506 9222
отделение 5860 9217
подобный 6783 9214
дерево 4910 9191
кафедра 3638 9169
предел 6557 9139
удаться 6205 9131
оборона 4455 9116
японский 4364 9097
вы 3870 9093
кг 4094 9086
документ 5157 9085
час 5332 9066
РФ 4057 9062
дворец 4143 9044
распространение 6546 9031
практический 7125 9030
применяться 6268 9027
депутат 4271 9007
сказать 5813 8989
рассказ 4379 8988
галактика 7356 8986
соответствовать 6712 8983
for 4846 8983
интерес 6363 8979
сражение 4112 8966
убить 5483 8959
уезд 5186 8957
целый 6958 8953
маленький 7051 8937
внимание 6887 8926
равный 5712 8891
мать 6290 8878
показать 6377 8867
способность 5272 8865
фон 5129 8860
смочь 6317 8849
восстание 4530 8848
ввести 6435 8821
понятие 4964 8810
определение 5498 8784
правило 6082 8768
достигнуть 6452 8758
сохраниться 6226 8754
словарь 5251 8751
сцена 4937 8735
согласно 6669 8734
голос 4939 8725
Рим 4309 8716
верховный 4724 8715
традиция 5664 8701
image 2163 8697
поддерживать 6258 8690
захватить 5114 8681
епископ 3353 8677
Константин 4558 8665
командир 3998 8662
объявить 6034 8660
признать 6003 8636
долгий 6934 8636
особенный 6717 8625
издать 6282 8623
сейчас 6688 8619
второе 6775 8612
классический 5851 8609
многочисленный 6957 8584
танк 1474 8573
иностранный 5539 8573
сведение 6969 8571
правление 5184 8560
Федор 4544 8558
проводить 6737 8557
глаз 5396 8548
сообщение 4793 8545
бывший 6802 8539
СПб 4415 8531
совместный 6770 8529
пока 6631 8506
означать 6589 8502
удар 4066 8490
Котор 7245 8487
существование 6178 8484
изучение 5608 8479
близкий 6963 8470
буква 3604 8461
рынок 4390 8455
религиозный 4872 8436
возникнуть 6644 8434
огонь 4375 8423
греческий 4530 8394
открытие 5709 8389
энциклопедия 6290 8373
химический 4489 8368