Πολυτονιστής: γράψτε απευθείας αρχαία ελληνικά

Οδηγίες

Δουλεύοντας με κείμενα στην ψηφιακή εποχή

>> Παρασκευή 12 Οκτωβρίου 2012

Αν έχετε περιέργεια για την ψηφιοποίηση κλασικών κειμένων και την κωδικοποίησή τους με ΤΕΙ XML, απλά κατεβάστε από το Github ένα παράδειγμα και μελετήστε τον κώδικα. Η εφαρμογή παρέχεται δωρεάν από την Bridget Almas (Alpheios Project & Perseus).
https://github.com/balmas/tei-digital-age

Παρακάτω δείτε ένα δείγμα από τη δημιουργία ενός Treebank. Τι είναι το Treebank; Η γνωστή μας συντακτική ανάλυση αποδίδεται σε  γλώσσα σήμανσης XML με ετικέτες και προσδιορισμούς, όπως ADV, OBJ etc. Η ιδιότυπη βάση δεδομένων αποδίδεται οπτικά με δενδροειδή μορφή στο Alpheios. Η σύνταξη με τον τρόπο αυτό εκτός από το εκπαιδευτικό ενδιαφέρον ανοίγει ένα μονοπάτι στην ανάλυση των κειμένων, καθώς μπορεί κανείς να έχει στατιστικά στοιχεία για τη συντακτική θέση μιας λέξης.

<treebank xmlns:treebank="http://nlp.perseus.tufts.edu/syntax/treebank/1.5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://nlp.perseus.tufts.edu/syntax/treebank/1.5/treebank-1.5.xsd" version="1.5" format="aldt" xml:lang="grc">
<sentence id="1" document_id="urn:cts:greekLang:tlg1396.tlg001.perseus-grc1">
<word id="1" form="ἐρρέτω" postag="v3spma--------" head="0" relation="PRED"/>
<word id="2" form="ἦμαρ" postag="n-s---nn------" head="10" relation="SBJ_CO"/>
<word id="3" form="ἐκεῖνο" postag="a-s---nn------" head="2" relation="ATR"/>
<word id="4" form="," postag="u-------------" head="10" relation="AuxX"/>
<word id="5" form="καὶ" postag="c-------------" head="10" relation="AuxY"/>
<word id="6" form="οὐλομένη" postag="a-s---fnp-----" head="7" relation="ATR"/>
<word id="7" form="σκοτόμαινα" postag="n-s---fn------" head="10" relation="SBJ_CO"/>
<word id="8" form="," postag="u-------------" head="10" relation="AuxX"/>
<word id="9" form="βρόμος" postag="n-s---mn------" head="10" relation="SBJ_CO"/>
<word id="10" form="τε" postag="g-------------" head="1" relation="COORD"/>
<word id="11" form="δεινὸς" postag="a-s---mnp-----" head="9" relation="ATR"/>
<word id="12" form="ἠνεμωμένης" postag="t-sr-efg------" head="13" relation="ATR"/>
<word id="13" form="ἁλός" postag="n-s---fg------" head="9" relation="ATR"/>
<word id="14" form="," postag="u-------------" head="18" relation="AuxX"/>
<word id="15" form="οἵ" postag="p-p---mn------" head="18" relation="SBJ"/>
<word id="16" form="ποτε" postag="g-------------" head="18" relation="ADV"/>
<word id="17" form="νῆ᾽" postag="n-s---fa------" head="18" relation="OBJ"/>
<word id="18" form="ἐκύλισαν" postag="v3paia--------" head="10" relation="ATR"/>
<word id="19" form="," postag="u-------------" head="29" relation="AuxX"/>
<word id="20" form="ἐφ᾽" postag="r-------------" head="29" relation="AuxP"/>
<word id="21" form="ἧς" postag="p-s---fg------" head="20" relation="ADV"/>
<word id="22" form="ὁ" postag="l-s---mn------" head="26" relation="ATR"/>
<word id="23" form="τὰ" postag="l-p---na------" head="24" relation="ATR"/>
<word id="24" form="πολλὰ" postag="a-p---nap-----" head="25" relation="AuxZ"/>
<word id="25" form="μελίφρων" postag="a-s---mnp-----" head="26" relation="ATR"/>
<word id="26" form="Ἀβδηρίων" postag="n-s---mn------" head="29" relation="SBJ"/>
<word id="27" form="ἄπρηκτα" postag="a-p---nap-----" head="29" relation="OBJ"/>
<word id="28" form="θεοῖσιν" postag="n-p---md------" head="29" relation="OBJ"/>
<word id="29" form="εὔχετο" postag="v3siie--------" head="17" relation="ATR"/>
<word id="30" form=":" postag="-" head="0" relation="AuxK"/>
</sentence>
<sentence id="2" document_id="urn:cts:greekLang:tlg1396.tlg001.perseus-grc1">
<word id="1" form="ῥαίσθη" postag="-" head="7" relation="PRED_CO"/>
<word id="2" form="γὰρ" postag="-" head="7" relation="AuxY"/>
<word id="3" form="διὰ" postag="-" head="1" relation="AuxP"/>
<word id="4" form="πάντα" postag="-" head="3" relation="ADV"/>
<word id="5" form="," postag="-" head="7" relation="AuxX"/>
<word id="6" form="προσηνέχθη" postag="-" head="7" relation="PRED_CO"/>
<word id="7" form="δὲ" postag="-" head="0" relation="COORD"/>
<word id="8" form="κλύδωνι" postag="-" head="6" relation="ADV"/>
<word id="9" form="τρηχεῖαν" postag="-" head="11" relation="ATR"/>
<word id="10" form="εἰς" postag="-" head="6" relation="AuxP"/>
<word id="11" form="Σέριφον" postag="-" head="10" relation="OBJ"/>
<word id="12" form="," postag="-" head="21" relation="AuxX"/>
<word id="13" form="αἰδοίων" postag="-" head="15" relation="ATR"/>
<word id="14" form="ὅθι" postag="-" head="21" relation="ADV"/>
<word id="15" form="προξείνων" postag="-" head="17" relation="ATR"/>
<word id="16" form="ὑπὸ" postag="-" head="18" relation="AuxP"/>
<word id="17" form="χερσὶ" postag="-" head="16" relation="OBJ"/>
<word id="18" form="λαχὼν" postag="-" head="21" relation="ADV"/>
<word id="19" form="πυρός" postag="-" head="18" relation="OBJ"/>
<word id="20" form="," postag="-" head="21" relation="AuxX"/>
<word id="21" form="ἵκετο" postag="-" head="11" relation="ATR"/>
<word id="22" form="πάτρην" postag="-" head="23" relation="ATR"/>
<word id="23" form="Ἄβδηρα" postag="-" head="21" relation="OBJ"/>
<word id="24" form="," postag="-" head="27" relation="AuxX"/>
<word id="25" form="κρωσσῷ" postag="-" head="27" relation="ADV"/>
<word id="26" form="χαλκέῳ" postag="-" head="25" relation="ATR"/>
<word id="27" form="περισταλείς" postag="-" head="21" relation="ADV"/>
<word id="28" form="." postag="-" head="0" relation="AuxK"/>
</sentence>
</treebank>
view raw treebank hosted with ❤ by GitHub

Δημοσίευση σχολίου

Αναζήτηση αυτού του ιστολογίου

Αναγνώστες

  © Blogger template Werd by Ourblogtemplates.com 2009

Back to TOP