Založ si blog

Hodnotenie systémov na podporu odhaľovania plagiátov

V medzinárodnej štúdii z roku 2020 Testing of Support Tools for Plagiarism Detection je uvedené výsledné hodnotenie pätnástich webových systémov na podporu odhaľovania plagiátov naprieč ôsmimi jazykmi (angličtina, čeština, lotyština, nemčina, slovenčina, španielčina, taliančina a turečtina) z hľadiska efektívnosti vyhľadávania podobností a z hľadiska ich použiteľnosti.

Hodnotenie jednotlivých systémov je znázornené v grafe[1], kde na osi X je celkové hodnotenie efektívnosti nachádzania podobností naprieč testovanými jazykmi a na osi Y je hodnotenie použiteľnosti.

Toto hodnotenie efektívnosti má svoju vypovedaciu schopnosť, ale požiadavka vysokej školy / univerzity na systém na podporu odhaľovania plagiátov bude iste sústredená len na niekoľko málo jazykov. V našich podmienkach povedzme na slovenčinu, češtinu, angličtinu, nemčinu, maďarčinu. Pre školy je preto hodnotenie efektívnosti vyhľadávania podobností podľa jazykových skupín resp. podľa jednotlivých jazykov veľmi dôležité.  

Výsledky testovania podľa jazykových skupín

Vráťme sa k výsledkom štúdie. Pozrime sa na systémy na podporu odhaľovania plagiátov z hľadiska vyhľadávania podobností podľa jazykových skupín: germánska (nemčina, angličtina), románska (taliančina, španielčina) a slovanská (čeština, slovenčina) a zamerajme sa na silnú štvorku.

Je zrejmé z porovnania systémov podľa jazykových skupín (Tabuľka 1) že systémy sú efektívnejšie pre germánsku a románsku jazykovú skupinu. Efektívnosť nachádzania podobností pre slovanskú jazykovú skupinu je badateľne nižšia. Medzi silnú štvorku sa najviac systémov vklinilo v slovanskej jazykovej skupine.

Len dva systémy, a to PlagAware a StrikePlagiarism, sa vklinili medzi silnú štvorku pre všetky tri jazykové skupiny, ale neboli lídrami ani v jednom prípade.

Tabuľka 1: Výsledky testovania podľa jazykových skupín

Výsledky testovania podľa jednotlivých jazykov

Výsledky testovania podľa jednotlivých jazykov pre silnú štvorku dokazujú, že majú schopných súperov. Medzi silnú štvorku sa najviac systémov vklinilo v lotyšskom (8) a českom jazyku (7). Najmenej systémov (2) sa vklinilo medzi silnú štvorku v anglickom jazyku.

Systém PlagAware je vklinený medzi silnú štvorku v každom z testovaných jazykov (v ôsmich), lídrom je nemčine. StrikePlagiarism je tam vklinený v siedmich jazykoch, lídrom je v češtine. PlagiarismCheck, Copyscape a Docoloc sú tam vklinené v šiestich jazykoch, PlagiarismCheck je lídrom v talianskom a lotyšskom jazyku.

Takýto pohľad podáva určitý obraz o slabinách silnej štvorky resp. o kvalite vklinených systémov.

Tabuľke 2: Poradie systémov podľa jednotlivých jazykov

Štúdia zarezonovala

Zanedlho po zverejnení výsledkov testovania Turnitin získal spoločnosť Unicheck (jún 2020) a v zápätí Urkund získal spoločnosť PlagScan (september 2020). Dá sa povedať, že „vyzobali“ to najlepšie z koláča. Po tejto akvizícii vystupuje Urkund pod menom Ouriginal. Takže zo silnej štvorky (PlagScan, Urkund, Unicheck, Turnitin) ostala dvojka (Turnitin a Ouriginal).

V marci 2021 Turnitin oznámil zámer získať spoločnosť Ouriginal. Táto potenciálna fúzia by výrazne rozšírila dosah Turnitinu (graf nižšie[2]). Platí to najmä pre Európu a Áziu. V súvislosti s týmto zámerom sa vynára otázka, či by takto Turnitin nezískal monopol na služby pre podporu odhaľovania plagiátorstva.

Kúpa Ouriginalu by priniesla Turnitinu približne 97 percent trhu v Ázii, 96 percent v Afrike, 88 percent v Európe, 86 percent v Oceánii, 83 percent na  Strednom Východe, 77 percent v Latinskej Amerike a 67 percent v Severnej Amerike.

Súvisiace články:

Výsledky analýzy efektívnosti nástrojov na podporu odhaľovania plagiátov


[1] Testing of Support Tools for Plagiarism Detection

[2] https://www.listedtech.com/blog/turnitin-acquiring-ouriginal-whats-left-on-the-market

Slovensko a akademická sloboda: ako sme na tom v porovnaní so svetom?

17.03.2023

Index akademickej slobody poskytuje prehľad o stave akademickej slobody vo svete.

Umelá inteligencia už zasadla do školských lavíc …

22.01.2023

Umelá inteligencia stáva súčasťou každodenného života, vrátane vzdelávania. Už je v školských laviciach a učitelia možno o tom ešte nevedia.

Školstvo je na ťahu, ale …

10.01.2023

Očakáva sa, že absolventi vysokých škôl budú odborne zdatní, všeobecne zruční, schopní kriticky myslieť (budú digitálne zruční, jazykovo zdatní, schopní komunikovať na úrovní, samostatní, tvoriví, schopní prinášať nové myšlienky, pracovať v tíme, ...). Ale naozaj sa dostanú k týmto schopnostiam a zručnostiam?

tank Leopard 2A4

Druhý nemecký leopard prichádza na Slovensko. Pozrite si tanky v akcii

27.03.2023 15:45

Posledné tri kusy prídu v decembri.

Romana Tabák

Tabák odchádza od Kollára. Vraj sa jej nepozdáva zahraničná politika hnutia

27.03.2023 15:32

Podľa informácii denníka Pravda však problém nastal pri zostavovaní kandidátky.

nemocnica-bory.sk-nemocnica-stavba-jesen-lozkove-oddelenie-pacient-exterie19

Štát sa dohodol s Pentou. Poistenci VšZP nebudú musieť na Boroch platiť

27.03.2023 15:24

Penta žiadala štát o zazmluvnenie Všeobecnej zdravotnej poisťovne (VšZP) ešte v polovici februára.

ampulky, očkovanie, lieky, injekcia

Nariadenie súdu zaplatiť drahý liek na výnimku je precedens, zhodli sa pacienti aj poisťovňa

27.03.2023 15:17

Rozhodnutie bratislavského okresného súdu o zaplatení lieku Zolgensma pre detskú pacientku je precedens.

julius petrus

Štatistiky blogu

Počet článkov: 66
Celková čítanosť: 112828x
Priemerná čítanosť článkov: 1710x

Autor blogu

Kategórie