Језичка лабораторија

Упутство

Увод

Језичка лабораторија има за крајњи циљ прављење, односно усавршавање граматичког речника српског језика у електронском облику и његово објављивање под слободном лиценцом, који је могуће даље користити као базу за израду других пројеката (провере правописа, анализатора текста, аутоматског превођења, граматичку проверу текста, и сличних напредних функција).

Регистровање

Регистровање на Језичку лабораторију врши се кликом на „направи налог“ у горњем десном углу. Потом је потребно унети своје податке, и, после клика на „Направи корисника“ регистрација је завршена. Корисничко име и шифра могу бити унети и ћирилицом.

Пријављивање

Пријављивање се врши на сличан начин као и регистровање, кликом на „пријави се“.

Мењање именице по падежима

До ове странице се стиже кликом на „Мењање именице по падежима“.

На страници треба укуцати падежне облике задате именице. Све облике треба уносити ћирилицом. Имена треба уносити великим словом а именице малим. Тачност унетих падежа може се контролисати у реченицама које су дате као примери.

Уколико неки од падежа има дублетни облик, унесите онај који вам се чини природнијим, а други облик можете додати у коментару. Уколико имате неку другу примедбу, и њу можете додати у коментар.

Уколико мислите да задата реч није именица или уопште није реч српског језика, можете кликнути десно на дугме „Није именица у номинативу једнине“ односно „Лоша реч“. Уколико нисте сигурни у падежне облике, једноставно кликните на „Прескочи“.

Могућ је и рад по појединачним падежима, међутим већина корисника налази да им је рад са више падежа одједном погоднији.

Речник

Речник је списак речи обрађених на пројекту. За сваку реч могуће је видети све унете облике, а за сваки облик број исказа и њихову тежину. Број исказа је једноставно број корисника који су унели исти облик за исту тврдњу. Тежина је њихова укупна тежина — постоји могућност да се неким корисницима да већа тежина него другима (нпр. да је један њихов унос „тежак“ као два уноса неког другог), али ово се користило само у раним данима речника кад је било веома мало корисника.

При досадашњем раду, установили смо да корисници праве мање од 1% грешака; због сигурности заокружујемо то на 1%. То значи да, ако нека тврдња има један исказ, може се сматрати да је вероватноћа њене тачности 99%; за два иста исказа, 99,99%; за три иста исказа, 99,9999%, што сматрамо задовољавајућем тачношћу за практичну употребу (једна грешка у милион). Ово се наравно односи на случајне грешке у куцању и сл. а не на систематске грешке које могу настати због различитог граматичког осећаја различитих корисника.

Речник је могуће преузети и у XML формату за даљу компјутерску обраду, са истим садржајем. Речник садржи само исказе са тежином 3 или већом, док сирови речник садржи све исказе.