Založ si blog

Hodnotenie systémov na podporu odhaľovania plagiátov

V medzinárodnej štúdii z roku 2020 Testing of Support Tools for Plagiarism Detection je uvedené výsledné hodnotenie pätnástich webových systémov na podporu odhaľovania plagiátov naprieč ôsmimi jazykmi (angličtina, čeština, lotyština, nemčina, slovenčina, španielčina, taliančina a turečtina) z hľadiska efektívnosti vyhľadávania podobností a z hľadiska ich použiteľnosti.

Hodnotenie jednotlivých systémov je znázornené v grafe[1], kde na osi X je celkové hodnotenie efektívnosti nachádzania podobností naprieč testovanými jazykmi a na osi Y je hodnotenie použiteľnosti.

Toto hodnotenie efektívnosti má svoju vypovedaciu schopnosť, ale požiadavka vysokej školy / univerzity na systém na podporu odhaľovania plagiátov bude iste sústredená len na niekoľko málo jazykov. V našich podmienkach povedzme na slovenčinu, češtinu, angličtinu, nemčinu, maďarčinu. Pre školy je preto hodnotenie efektívnosti vyhľadávania podobností podľa jazykových skupín resp. podľa jednotlivých jazykov veľmi dôležité.  

Výsledky testovania podľa jazykových skupín

Vráťme sa k výsledkom štúdie. Pozrime sa na systémy na podporu odhaľovania plagiátov z hľadiska vyhľadávania podobností podľa jazykových skupín: germánska (nemčina, angličtina), románska (taliančina, španielčina) a slovanská (čeština, slovenčina) a zamerajme sa na silnú štvorku.

Je zrejmé z porovnania systémov podľa jazykových skupín (Tabuľka 1) že systémy sú efektívnejšie pre germánsku a románsku jazykovú skupinu. Efektívnosť nachádzania podobností pre slovanskú jazykovú skupinu je badateľne nižšia. Medzi silnú štvorku sa najviac systémov vklinilo v slovanskej jazykovej skupine.

Len dva systémy, a to PlagAware a StrikePlagiarism, sa vklinili medzi silnú štvorku pre všetky tri jazykové skupiny, ale neboli lídrami ani v jednom prípade.

Tabuľka 1: Výsledky testovania podľa jazykových skupín

Výsledky testovania podľa jednotlivých jazykov

Výsledky testovania podľa jednotlivých jazykov pre silnú štvorku dokazujú, že majú schopných súperov. Medzi silnú štvorku sa najviac systémov vklinilo v lotyšskom (8) a českom jazyku (7). Najmenej systémov (2) sa vklinilo medzi silnú štvorku v anglickom jazyku.

Systém PlagAware je vklinený medzi silnú štvorku v každom z testovaných jazykov (v ôsmich), lídrom je nemčine. StrikePlagiarism je tam vklinený v siedmich jazykoch, lídrom je v češtine. PlagiarismCheck, Copyscape a Docoloc sú tam vklinené v šiestich jazykoch, PlagiarismCheck je lídrom v talianskom a lotyšskom jazyku.

Takýto pohľad podáva určitý obraz o slabinách silnej štvorky resp. o kvalite vklinených systémov.

Tabuľke 2: Poradie systémov podľa jednotlivých jazykov

Štúdia zarezonovala

Zanedlho po zverejnení výsledkov testovania Turnitin získal spoločnosť Unicheck (jún 2020) a v zápätí Urkund získal spoločnosť PlagScan (september 2020). Dá sa povedať, že „vyzobali“ to najlepšie z koláča. Po tejto akvizícii vystupuje Urkund pod menom Ouriginal. Takže zo silnej štvorky (PlagScan, Urkund, Unicheck, Turnitin) ostala dvojka (Turnitin a Ouriginal).

V marci 2021 Turnitin oznámil zámer získať spoločnosť Ouriginal. Táto potenciálna fúzia by výrazne rozšírila dosah Turnitinu (graf nižšie[2]). Platí to najmä pre Európu a Áziu. V súvislosti s týmto zámerom sa vynára otázka, či by takto Turnitin nezískal monopol na služby pre podporu odhaľovania plagiátorstva.

Kúpa Ouriginalu by priniesla Turnitinu približne 97 percent trhu v Ázii, 96 percent v Afrike, 88 percent v Európe, 86 percent v Oceánii, 83 percent na  Strednom Východe, 77 percent v Latinskej Amerike a 67 percent v Severnej Amerike.


[1] Testing of Support Tools for Plagiarism Detection

[2] https://www.listedtech.com/blog/turnitin-acquiring-ouriginal-whats-left-on-the-market

Vláda pripravila STOP pre študentské práce písané na objednávku

07.10.2021

Písanie prác pre študentov na objednávku bude považované za trestný čin.

Hrubozrnní plagiátori

20.09.2021

Niekoľko príkladov nesofistikovaného a sofistikovaného plagiátorstva

Plagiátorstvo najhrubšieho zrna

12.09.2021

Čo môžeme považovať za plagiátorstvo najhrubšieho zrna?

jemen

Jemenská koalícia hlási 165 zabitých povstalcov

17.10.2021 21:47

Koalícia uviedla, že počas uplynulého týždňa v oblasti zabila približne 1000 jemenských šiitských povstalcov.

dážď, Viktor Orbán, dáždnik

V maďarských voľbách 2022 bude opozičným vyzývateľom Orbána zrejme Péter Márki-Zay

17.10.2021 21:04

Po sčítaní viac ako polovice odovzdaných hlasov - mal Márki bezpečný náskok.

Poľsko Bielorusko Varšava migranti protest

V Poľsku sa konali protesty proti vytláčaniu ilegálnych migrantov do Bieloruska

17.10.2021 20:33

O prechod z Bieloruska na územie krajín na východnej hranici Európskej únie sa v posledných mesiacoch pokúšajú tisíce migrantov.

Andrej Babiš

Zeman Babišovi údajne prisľúbil dva pokusy na zostavenie vlády

17.10.2021 19:32

Babiš povedal, že túto šancu nevyužije, a to z toho dôvodu, aby mohla do Vianoc vzniknúť nová vláda zložená z opozičných koalícií SPOLU a PirSTAN.

Peťo Kravjar

Štatistiky blogu

Počet článkov: 30
Celková čítanosť: 42333x
Priemerná čítanosť článkov: 1411x

Autor blogu

Kategórie