Založ si blog

Hodnotenie systémov na podporu odhaľovania plagiátov

V medzinárodnej štúdii z roku 2020 Testing of Support Tools for Plagiarism Detection je uvedené výsledné hodnotenie pätnástich webových systémov na podporu odhaľovania plagiátov naprieč ôsmimi jazykmi (angličtina, čeština, lotyština, nemčina, slovenčina, španielčina, taliančina a turečtina) z hľadiska efektívnosti vyhľadávania podobností a z hľadiska ich použiteľnosti.

Hodnotenie jednotlivých systémov je znázornené v grafe[1], kde na osi X je celkové hodnotenie efektívnosti nachádzania podobností naprieč testovanými jazykmi a na osi Y je hodnotenie použiteľnosti.

Toto hodnotenie efektívnosti má svoju vypovedaciu schopnosť, ale požiadavka vysokej školy / univerzity na systém na podporu odhaľovania plagiátov bude iste sústredená len na niekoľko málo jazykov. V našich podmienkach povedzme na slovenčinu, češtinu, angličtinu, nemčinu, maďarčinu. Pre školy je preto hodnotenie efektívnosti vyhľadávania podobností podľa jazykových skupín resp. podľa jednotlivých jazykov veľmi dôležité.  

Výsledky testovania podľa jazykových skupín

Vráťme sa k výsledkom štúdie. Pozrime sa na systémy na podporu odhaľovania plagiátov z hľadiska vyhľadávania podobností podľa jazykových skupín: germánska (nemčina, angličtina), románska (taliančina, španielčina) a slovanská (čeština, slovenčina) a zamerajme sa na silnú štvorku.

Je zrejmé z porovnania systémov podľa jazykových skupín (Tabuľka 1) že systémy sú efektívnejšie pre germánsku a románsku jazykovú skupinu. Efektívnosť nachádzania podobností pre slovanskú jazykovú skupinu je badateľne nižšia. Medzi silnú štvorku sa najviac systémov vklinilo v slovanskej jazykovej skupine.

Len dva systémy, a to PlagAware a StrikePlagiarism, sa vklinili medzi silnú štvorku pre všetky tri jazykové skupiny, ale neboli lídrami ani v jednom prípade.

Tabuľka 1: Výsledky testovania podľa jazykových skupín

Výsledky testovania podľa jednotlivých jazykov

Výsledky testovania podľa jednotlivých jazykov pre silnú štvorku dokazujú, že majú schopných súperov. Medzi silnú štvorku sa najviac systémov vklinilo v lotyšskom (8) a českom jazyku (7). Najmenej systémov (2) sa vklinilo medzi silnú štvorku v anglickom jazyku.

Systém PlagAware je vklinený medzi silnú štvorku v každom z testovaných jazykov (v ôsmich), lídrom je nemčine. StrikePlagiarism je tam vklinený v siedmich jazykoch, lídrom je v češtine. PlagiarismCheck, Copyscape a Docoloc sú tam vklinené v šiestich jazykoch, PlagiarismCheck je lídrom v talianskom a lotyšskom jazyku.

Takýto pohľad podáva určitý obraz o slabinách silnej štvorky resp. o kvalite vklinených systémov.

Tabuľke 2: Poradie systémov podľa jednotlivých jazykov

Štúdia zarezonovala

Zanedlho po zverejnení výsledkov testovania Turnitin získal spoločnosť Unicheck (jún 2020) a v zápätí Urkund získal spoločnosť PlagScan (september 2020). Dá sa povedať, že „vyzobali“ to najlepšie z koláča. Po tejto akvizícii vystupuje Urkund pod menom Ouriginal. Takže zo silnej štvorky (PlagScan, Urkund, Unicheck, Turnitin) ostala dvojka (Turnitin a Ouriginal).

V marci 2021 Turnitin oznámil zámer získať spoločnosť Ouriginal. Táto potenciálna fúzia by výrazne rozšírila dosah Turnitinu (graf nižšie[2]). Platí to najmä pre Európu a Áziu. V súvislosti s týmto zámerom sa vynára otázka, či by takto Turnitin nezískal monopol na služby pre podporu odhaľovania plagiátorstva.

Kúpa Ouriginalu by priniesla Turnitinu približne 97 percent trhu v Ázii, 96 percent v Afrike, 88 percent v Európe, 86 percent v Oceánii, 83 percent na  Strednom Východe, 77 percent v Latinskej Amerike a 67 percent v Severnej Amerike.

Súvisiace články:

Výsledky analýzy efektívnosti nástrojov na podporu odhaľovania plagiátov


[1] Testing of Support Tools for Plagiarism Detection

[2] https://www.listedtech.com/blog/turnitin-acquiring-ouriginal-whats-left-on-the-market

Životaschopnosť inštitúcie

01.12.2023

Prežiť a dlhodobo prosperovať patrí medzi ciele mnohých inštitúcií/podnikov a to štátnych aj neštátnych.

Koniec jedného mýtu

24.11.2023

Podľa posledných výskumov k deľbe práce medzi mužmi a ženami došlo až s nástupom poľnohospodárstva, t. j. cca pred 12 000 rokmi.

Kde si sa podela, Národná stratégia pre umelú inteligenciu (UI)?

21.11.2023

Rýchly prienik aplikácií umelej inteligencie do širokej škály ľudských aktivít má svoje plusy a mínusy. Preto mnoho štátov pripravilo národné stratégie pre umelú inteligenciu a od nich sa odvíjajú národné stratégie jednotlivých odvetví.

fico, pellegrini, danko

Prieskum: Takmer dve tretiny ľudí si myslia, že vláda vydrží celé štyri roky

07.12.2023 23:27

Podľa krajov veria koalícii najčastejšie obyvatelia Trenčianskeho, Trnavského, Banskobystrického, Bratislavského a Žilinského kraja.

APTOPIX Netherlands World Press Photo

Katalóg World Press Photo nemá na obálke víťaznú fotografiu z Mariupolu

07.12.2023 23:19

Nadácia World Press Photo na obálku neumiestnila víťaznú fotografiu pre jej explicitný obsah.

Benátky, Taliansko

Aktivisti postriekali bahnom Baziliku svätého Marka v Benátkach

07.12.2023 22:42

Akciou protestovali proti podľa nich neadektávnym politikám v boji s klimatickou zmenou.

karabach

Arménsko a Azerbajdžan sa dohodli na výmene zajatcov i normalizácii vzťahov

07.12.2023 22:19

Azerbajdžan a Arménsko vedú dlhodobý konflikt o územie Náhorného Karabachu.

julius petrus

Štatistiky blogu

Počet článkov: 86
Celková čítanosť: 148765x
Priemerná čítanosť článkov: 1730x

Autor blogu

Kategórie