logo
POPISI

/

Serijske publikacije

/

Prispevki za novejšo zgodovino

Predicting Slovene Text Complexity Using Readability Measures


Soavtor(ji):Jure Gašparič (gl. ur.)
Leto:2019
Založnik(i):Inštitut za novejšo zgodovino, Ljubljana
Jezik(i):angleščina
Vrst(e) gradiva:besedilo
Avtorske pravice:
CC license

To delo avtorjev Tadej Škvorc, Simon Krek, Senja Pollak, Špela Arhar Holdt, Marko Robnik-Šikonja je ponujeno pod Creative Commons Priznanje avtorstva-Nekomercialno-Deljenje pod enakimi pogoji 4.0 Mednarodna

Datoteke (1)
Ime:PNZ_1_2019_web.pdf
Velikost:2.47MB
Format:application/pdf
Odpri
Prenesi
Opis
Večina obstoječih formul za merjenje berljivosti je zasnovana za besedila v angleškem jeziku, na katerih je tudi ocenjena njihova kakovost. V našem članku predstavimo prilagoditev izbranih mer za slovenščino. Uspešnost desetih znanih formul ter osmih dodatnih kriterijev berljivosti ocenimo na petih skupinah besedil: otroških revijah, splošnih revijah, časopisih, tehničnih revijah in zapisnikih sej državnega zbora. Te skupine besedil imajo različne ciljne publike, zaradi česar predpostavimo, da uporabljajo različne stile pisanja, ki bi jih formule in kriteriji berljivosti morali zaznati. V analizi pokažemo, katere formule in kriteriji berljivosti delujejo dobro in s katerimi razlik med skupinami nismo mogli zaznati.
Metapodatki (11)
  • identifikatorhttps://hdl.handle.net/11686/44943
    • naslov
      • Predicting Slovene Text Complexity Using Readability Measures
    • avtor
      • Tadej Škvorc
      • Simon Krek
      • Senja Pollak
      • Špela Arhar Holdt
      • Marko Robnik-Šikonja
    • soavtor
      • Jure Gašparič (gl. ur.)
    • predmet
      • berljivost
      • obdelava naravnega jezika
      • analiza besedil
      • readability
      • natural language processing
      • text analysis
    • založnik
      • Inštitut za novejšo zgodovino
    • datum
      • 2019
      • 01. 01. 2019
    • tip
      • besedilo
    • jezik
      • Angleščina
    • jeDelOd
    • pravice
      • licenca: ccByNcSa
    Seznam literature v delu (30)
    StranAvtorNaslovVirKrajZaložbaLeto
    Anderson, JonathanLIX and RIX : Variations on a little-known readability indexJournal of ReadingNewarkInternational Literacy Association1983
    Arhar Holdt, ŠpelaUčni korpus SSJ in leksikon besednih oblik za slovenščinoJezik in slovstvoLjubljanaSlavistično društvo Slovenije2009
    Bailin, Alan ; Grafstein, AnnReadability : text and contextBasingstoke ; New YorkPalgrave Macmillan2016
    Barzilay, Regina ; Lapata, MirellaModeling local coherence : An entity-based approachComputational LinguisticsCambridge, MAMIT Press Journals2008
    Logar, Nataša ; Šuster, SimonGradnja novega korpusa slovenščineLjubljanaSlavistično društvo Slovenije2009
    Logar, Nataša ; Grčar, Miha ; Brakus, Marko ; Erjavec, Tomaž ; Arhar Holdt, Špela ; Krek, Simon ; Kosem, IztokKorpusi slovenskega jezika Gigafida, KRES, ccGigafida in ccKRES : gradnja, vsebina, uporabaLjubljanaTrojina, zavod za uporabno slovenistiko : Fakulteta za družbene vede2012
    Breiman, LeoRandom forestsMachine learningNorwell (MA) ; DordrechtKluwer Academic Publishers2001
    Chen, Tianqi ; Guestrin, CarlosXgboost : A scalable tree boosting systemProceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data miningACM2016
    Coleman, Meri ; Liau, Ta LinA computer readability formula designed for machine scoringJournal of Applied PsychologyWashingtonAmerican Psychological Association1975
    Crossley, Scott A. ; Kyle, Kristopher ; McNamara, Danielle S.The tool for the automatic analysis of text cohesion (TAACO) : Automatic assessment of local, global, and text cohesionBehavior research methodsAustin, Tex.The Society2016
    Dale, Edgar ; Chall, Jeanne S.A formula for predicting readability : InstructionsEducational research bulletinColumbus, OhioBureau of Educational Research, Ohio State University1948
    Dębowski, Łukasz ; Broda, Bartosz ; Nitoń, Bartłomiej ; Charzyńska, EdytaJasnopis–A Program to Compute Readability of Texts in Polish Based on Psycholinguistic ResearchNatural Language Processing and Cognitive ScienceLiberiaEditrice Cafoscarina
    Fišer, Darja ; Erjavec, Tomaž ; Zwitter Vitez, Ana ; Ljubešić, NikolaJANES se predstavi : metode, orodja in viri za nestandardno pisno spletno slovenščinoJezikovne tehnologije : zbornik 17. mednarodne multikonference Informacijska družba - IS 2014, 9. - 10. oktober 2014, [Ljubljana, Slovenia] : zvezek GLjubljanaInstitut Jožef Stefan2014
    François, Thomas ; Miltsakaki, EleniDo NLP and machine learning improve traditional readability formulas?Proceedings of the First Workshop on Predicting and Improving Text Readability for target reader populationsAssociation for Computational Linguistics2012
    Grčar, Miha ; Krek, Simon ; Dobrovoljc, KajaObeliks : statistični oblikoskladenjski označevalnik in lematizator za slovenski jezikZbornik Osme konference Jezikovne tehnologije, 8. do 12. oktober 2012, Ljubljana, Slovenia : zbornik 15. mednarodne multikonference Informacijska družba - IS 2012, zvezek CLjubljanaInstitut Jožef Stefan2012
    Gunning, RobertThe technique of clear writingTorontoMcGraw-Hill1952
    Justin, JanezUčbenik kot dejavnik uspešnosti kurikularne prenove : poročilo o rezultatih evalvacijske študije2003
    Kilgarriff, Adam ; Charalabopoulou, Frieda ; Gavrilidou, Maria ; Bondi Johannessen, Janne ; Khalil, Saussan ; Johansson Kokkinakis, Sofie ; Lew, Robert ; Sharoff, Serge ; Vadlapudi, Ravikiran ; Volodina, ElenaCorpus-based vocabulary lists for language learners for nine languagesLanguage resources and evaluationDordrechtKluwer ; Springer2014
    Kincaid, J., Peter ; Fishburne Jr., Robert P. ; Rogers, Richard L. ; Chissom, Brad S.Derivation of new readability formulas (Automated Readability Index, Fog Count and Flesch Reading Ease formula) for navy enlisted personnel. Report No. 8-75Millington, TennesseeInstitute for Simulation and Training1975
    Kononenko, Igor ; Kukar, MatjažMachine learning and data mining : introduction to principles and algorithmsChichesterHorwood Publishing, cop.2007
    Kosem, Iztok ; Rozman, Tadeja ; Stritar Kučuk, MojcaHow do Slovenian primary and secondary school students write and what their teachers correct : a corpus of student writingProceedings : Corpus linguistics conferenceBirminghamUniversity2011
    Lu, XiaofeiAutomatic measurement of syntactic complexity in child language acquisitionInternational Journal of Corpus LinguisticsAmsterdam ; Philadelphia, PAJohn Benjamins Publishing Company2009
    McLaughlin, G. HarrySMOG grading - a new readability formulaJournal of reading1969
    Senter, R.J. ; Smith, Edgar A.Automated readability indexOhioUniversity of Cincinnati1967
    Sherman, Lucius AdelnoAnalytics of literature : A manual for the objective study of English prose and poetryBostonGinn1893
    Škvorc, Tadej ; Krek, Simon ; Pollak, Senja ; Arhar Holdt, Špela ; Robnik Šikonja, MarkoEvaluation of Statistical Readability Measures on Slovene textsZbornik konference Jezikovne tehnologije in digitalna humanistika, 20. september - 21. september 2018, Ljubljana, SlovenijaLjubljanaZnanstvena založba Filozofske fakultete2018
    Spache, GeorgeA new readability formula for primary-grade reading materialsThe Elementary School JournalChicagoUniversity of Chicago Press1953
    Verdonik, Darinka ; Zwitter Vitez, AnaSlovenski govorni korpus GosLjubljanaTrojina, zavod za uporabno slovenistiko2011
    Wiersma, Wybo ; Nerbonne, John ; Lauttamus, TimoAutomatically extracting typical syntactic differences from corporaLiterary and Linguistic ComputingOxfordOxford University Press2010
    Zwitter Vitez, AnaUgotavljanje avtorstva besedil: primer "Trenirkarjev"Jezikovne tehnologije : zbornik 17. mednarodne multikonference Informacijska družba - IS 2014, 9. - 10. oktober 2014LjubljanaInstitut Jožef Stefan2014