V medzinárodnej štúdii z roku 2020 Testing of Support Tools for Plagiarism Detection je uvedené výsledné hodnotenie pätnástich webových systémov na podporu odhaľovania plagiátov naprieč ôsmimi jazykmi (angličtina, čeština, lotyština, nemčina, slovenčina, španielčina, taliančina a turečtina) z hľadiska efektívnosti vyhľadávania podobností a z hľadiska ich použiteľnosti.
Hodnotenie jednotlivých systémov je znázornené v grafe[1], kde na osi X je celkové hodnotenie efektívnosti nachádzania podobností naprieč testovanými jazykmi a na osi Y je hodnotenie použiteľnosti.
Toto hodnotenie efektívnosti má svoju vypovedaciu schopnosť, ale požiadavka vysokej školy / univerzity na systém na podporu odhaľovania plagiátov bude iste sústredená len na niekoľko málo jazykov. V našich podmienkach povedzme na slovenčinu, češtinu, angličtinu, nemčinu, maďarčinu. Pre školy je preto hodnotenie efektívnosti vyhľadávania podobností podľa jazykových skupín resp. podľa jednotlivých jazykov veľmi dôležité.
Výsledky testovania podľa jazykových skupín
Vráťme sa k výsledkom štúdie. Pozrime sa na systémy na podporu odhaľovania plagiátov z hľadiska vyhľadávania podobností podľa jazykových skupín: germánska (nemčina, angličtina), románska (taliančina, španielčina) a slovanská (čeština, slovenčina) a zamerajme sa na silnú štvorku.
Je zrejmé z porovnania systémov podľa jazykových skupín (Tabuľka 1) že systémy sú efektívnejšie pre germánsku a románsku jazykovú skupinu. Efektívnosť nachádzania podobností pre slovanskú jazykovú skupinu je badateľne nižšia. Medzi silnú štvorku sa najviac systémov vklinilo v slovanskej jazykovej skupine.
Len dva systémy, a to PlagAware a StrikePlagiarism, sa vklinili medzi silnú štvorku pre všetky tri jazykové skupiny, ale neboli lídrami ani v jednom prípade.
Tabuľka 1: Výsledky testovania podľa jazykových skupín
Výsledky testovania podľa jednotlivých jazykov
Výsledky testovania podľa jednotlivých jazykov pre silnú štvorku dokazujú, že majú schopných súperov. Medzi silnú štvorku sa najviac systémov vklinilo v lotyšskom (8) a českom jazyku (7). Najmenej systémov (2) sa vklinilo medzi silnú štvorku v anglickom jazyku.
Systém PlagAware je vklinený medzi silnú štvorku v každom z testovaných jazykov (v ôsmich), lídrom je nemčine. StrikePlagiarism je tam vklinený v siedmich jazykoch, lídrom je v češtine. PlagiarismCheck, Copyscape a Docoloc sú tam vklinené v šiestich jazykoch, PlagiarismCheck je lídrom v talianskom a lotyšskom jazyku.
Takýto pohľad podáva určitý obraz o slabinách silnej štvorky resp. o kvalite vklinených systémov.
Tabuľke 2: Poradie systémov podľa jednotlivých jazykov
Štúdia zarezonovala
Zanedlho po zverejnení výsledkov testovania Turnitin získal spoločnosť Unicheck (jún 2020) a v zápätí Urkund získal spoločnosť PlagScan (september 2020). Dá sa povedať, že „vyzobali“ to najlepšie z koláča. Po tejto akvizícii vystupuje Urkund pod menom Ouriginal. Takže zo silnej štvorky (PlagScan, Urkund, Unicheck, Turnitin) ostala dvojka (Turnitin a Ouriginal).
V marci 2021 Turnitin oznámil zámer získať spoločnosť Ouriginal. Táto potenciálna fúzia by výrazne rozšírila dosah Turnitinu (graf nižšie[2]). Platí to najmä pre Európu a Áziu. V súvislosti s týmto zámerom sa vynára otázka, či by takto Turnitin nezískal monopol na služby pre podporu odhaľovania plagiátorstva.
Kúpa Ouriginalu by priniesla Turnitinu približne 97 percent trhu v Ázii, 96 percent v Afrike, 88 percent v Európe, 86 percent v Oceánii, 83 percent na Strednom Východe, 77 percent v Latinskej Amerike a 67 percent v Severnej Amerike.
Súvisiace články:
Výsledky analýzy efektívnosti nástrojov na podporu odhaľovania plagiátov
[1] Testing of Support Tools for Plagiarism Detection
[2] https://www.listedtech.com/blog/turnitin-acquiring-ouriginal-whats-left-on-the-market
Celá debata | RSS tejto debaty