/
Neobjavljeno
Besedilni korpus sejnih zapisnikov Skupščine Socialistične republike Slovenije (1963-1990).
Besedilni korpus nastaja postopoma v okviru dejavnosti Raziskovalne infrastrukture Slovenskega zgodovinopisja (SIstory in DARIAH-SI) in je dosegljiv tudi na GitHub.
Originalni vir so PDF dateteke, ki se nahajajo na SIstory. Najprej se opravi preverjanje in validacija OCR, ki mu sledi pretvorba v XML po priporočilih za zapis besedil TEI P5 (Text Encoding Initiative) in dodatno kodiranje strukture besedila. Govori poslancev so kodirani v skladu s TEI modulom za dramska besedila. Deli XML dokumentov, ki so v glavne XML dokumente vključeni s pomočjo mehanizma XInclude, so dosegljivi samo na GitHub.