Δουλεύοντας με κείμενα στην ψηφιακή εποχή
>> Παρασκευή 12 Οκτωβρίου 2012
Αν έχετε περιέργεια για την ψηφιοποίηση κλασικών κειμένων και την κωδικοποίησή τους με ΤΕΙ XML, απλά κατεβάστε από το Github ένα παράδειγμα και μελετήστε τον κώδικα. Η εφαρμογή παρέχεται δωρεάν από την Bridget Almas (Alpheios Project & Perseus).
https://github.com/balmas/tei-digital-age
Παρακάτω δείτε ένα δείγμα από τη δημιουργία ενός Treebank. Τι είναι το Treebank; Η γνωστή μας συντακτική ανάλυση αποδίδεται σε γλώσσα σήμανσης XML με ετικέτες και προσδιορισμούς, όπως ADV, OBJ etc. Η ιδιότυπη βάση δεδομένων αποδίδεται οπτικά με δενδροειδή μορφή στο Alpheios. Η σύνταξη με τον τρόπο αυτό εκτός από το εκπαιδευτικό ενδιαφέρον ανοίγει ένα μονοπάτι στην ανάλυση των κειμένων, καθώς μπορεί κανείς να έχει στατιστικά στοιχεία για τη συντακτική θέση μιας λέξης.
https://github.com/balmas/tei-digital-age
Παρακάτω δείτε ένα δείγμα από τη δημιουργία ενός Treebank. Τι είναι το Treebank; Η γνωστή μας συντακτική ανάλυση αποδίδεται σε γλώσσα σήμανσης XML με ετικέτες και προσδιορισμούς, όπως ADV, OBJ etc. Η ιδιότυπη βάση δεδομένων αποδίδεται οπτικά με δενδροειδή μορφή στο Alpheios. Η σύνταξη με τον τρόπο αυτό εκτός από το εκπαιδευτικό ενδιαφέρον ανοίγει ένα μονοπάτι στην ανάλυση των κειμένων, καθώς μπορεί κανείς να έχει στατιστικά στοιχεία για τη συντακτική θέση μιας λέξης.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
<treebank xmlns:treebank="http://nlp.perseus.tufts.edu/syntax/treebank/1.5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://nlp.perseus.tufts.edu/syntax/treebank/1.5/treebank-1.5.xsd" version="1.5" format="aldt" xml:lang="grc"> | |
<sentence id="1" document_id="urn:cts:greekLang:tlg1396.tlg001.perseus-grc1"> | |
<word id="1" form="ἐρρέτω" postag="v3spma--------" head="0" relation="PRED"/> | |
<word id="2" form="ἦμαρ" postag="n-s---nn------" head="10" relation="SBJ_CO"/> | |
<word id="3" form="ἐκεῖνο" postag="a-s---nn------" head="2" relation="ATR"/> | |
<word id="4" form="," postag="u-------------" head="10" relation="AuxX"/> | |
<word id="5" form="καὶ" postag="c-------------" head="10" relation="AuxY"/> | |
<word id="6" form="οὐλομένη" postag="a-s---fnp-----" head="7" relation="ATR"/> | |
<word id="7" form="σκοτόμαινα" postag="n-s---fn------" head="10" relation="SBJ_CO"/> | |
<word id="8" form="," postag="u-------------" head="10" relation="AuxX"/> | |
<word id="9" form="βρόμος" postag="n-s---mn------" head="10" relation="SBJ_CO"/> | |
<word id="10" form="τε" postag="g-------------" head="1" relation="COORD"/> | |
<word id="11" form="δεινὸς" postag="a-s---mnp-----" head="9" relation="ATR"/> | |
<word id="12" form="ἠνεμωμένης" postag="t-sr-efg------" head="13" relation="ATR"/> | |
<word id="13" form="ἁλός" postag="n-s---fg------" head="9" relation="ATR"/> | |
<word id="14" form="," postag="u-------------" head="18" relation="AuxX"/> | |
<word id="15" form="οἵ" postag="p-p---mn------" head="18" relation="SBJ"/> | |
<word id="16" form="ποτε" postag="g-------------" head="18" relation="ADV"/> | |
<word id="17" form="νῆ᾽" postag="n-s---fa------" head="18" relation="OBJ"/> | |
<word id="18" form="ἐκύλισαν" postag="v3paia--------" head="10" relation="ATR"/> | |
<word id="19" form="," postag="u-------------" head="29" relation="AuxX"/> | |
<word id="20" form="ἐφ᾽" postag="r-------------" head="29" relation="AuxP"/> | |
<word id="21" form="ἧς" postag="p-s---fg------" head="20" relation="ADV"/> | |
<word id="22" form="ὁ" postag="l-s---mn------" head="26" relation="ATR"/> | |
<word id="23" form="τὰ" postag="l-p---na------" head="24" relation="ATR"/> | |
<word id="24" form="πολλὰ" postag="a-p---nap-----" head="25" relation="AuxZ"/> | |
<word id="25" form="μελίφρων" postag="a-s---mnp-----" head="26" relation="ATR"/> | |
<word id="26" form="Ἀβδηρίων" postag="n-s---mn------" head="29" relation="SBJ"/> | |
<word id="27" form="ἄπρηκτα" postag="a-p---nap-----" head="29" relation="OBJ"/> | |
<word id="28" form="θεοῖσιν" postag="n-p---md------" head="29" relation="OBJ"/> | |
<word id="29" form="εὔχετο" postag="v3siie--------" head="17" relation="ATR"/> | |
<word id="30" form=":" postag="-" head="0" relation="AuxK"/> | |
</sentence> | |
<sentence id="2" document_id="urn:cts:greekLang:tlg1396.tlg001.perseus-grc1"> | |
<word id="1" form="ῥαίσθη" postag="-" head="7" relation="PRED_CO"/> | |
<word id="2" form="γὰρ" postag="-" head="7" relation="AuxY"/> | |
<word id="3" form="διὰ" postag="-" head="1" relation="AuxP"/> | |
<word id="4" form="πάντα" postag="-" head="3" relation="ADV"/> | |
<word id="5" form="," postag="-" head="7" relation="AuxX"/> | |
<word id="6" form="προσηνέχθη" postag="-" head="7" relation="PRED_CO"/> | |
<word id="7" form="δὲ" postag="-" head="0" relation="COORD"/> | |
<word id="8" form="κλύδωνι" postag="-" head="6" relation="ADV"/> | |
<word id="9" form="τρηχεῖαν" postag="-" head="11" relation="ATR"/> | |
<word id="10" form="εἰς" postag="-" head="6" relation="AuxP"/> | |
<word id="11" form="Σέριφον" postag="-" head="10" relation="OBJ"/> | |
<word id="12" form="," postag="-" head="21" relation="AuxX"/> | |
<word id="13" form="αἰδοίων" postag="-" head="15" relation="ATR"/> | |
<word id="14" form="ὅθι" postag="-" head="21" relation="ADV"/> | |
<word id="15" form="προξείνων" postag="-" head="17" relation="ATR"/> | |
<word id="16" form="ὑπὸ" postag="-" head="18" relation="AuxP"/> | |
<word id="17" form="χερσὶ" postag="-" head="16" relation="OBJ"/> | |
<word id="18" form="λαχὼν" postag="-" head="21" relation="ADV"/> | |
<word id="19" form="πυρός" postag="-" head="18" relation="OBJ"/> | |
<word id="20" form="," postag="-" head="21" relation="AuxX"/> | |
<word id="21" form="ἵκετο" postag="-" head="11" relation="ATR"/> | |
<word id="22" form="πάτρην" postag="-" head="23" relation="ATR"/> | |
<word id="23" form="Ἄβδηρα" postag="-" head="21" relation="OBJ"/> | |
<word id="24" form="," postag="-" head="27" relation="AuxX"/> | |
<word id="25" form="κρωσσῷ" postag="-" head="27" relation="ADV"/> | |
<word id="26" form="χαλκέῳ" postag="-" head="25" relation="ATR"/> | |
<word id="27" form="περισταλείς" postag="-" head="21" relation="ADV"/> | |
<word id="28" form="." postag="-" head="0" relation="AuxK"/> | |
</sentence> | |
</treebank> |
0 σχόλια:
Δημοσίευση σχολίου