Δουλεύοντας με κείμενα στην ψηφιακή εποχή
>> Παρασκευή 12 Οκτωβρίου 2012
Αν έχετε περιέργεια για την ψηφιοποίηση κλασικών κειμένων και την κωδικοποίησή τους με ΤΕΙ XML, απλά κατεβάστε από το Github ένα παράδειγμα και μελετήστε τον κώδικα. Η εφαρμογή παρέχεται δωρεάν από την Bridget Almas (Alpheios Project & Perseus).
https://github.com/balmas/tei-digital-age
Παρακάτω δείτε ένα δείγμα από τη δημιουργία ενός Treebank. Τι είναι το Treebank; Η γνωστή μας συντακτική ανάλυση αποδίδεται σε γλώσσα σήμανσης XML με ετικέτες και προσδιορισμούς, όπως ADV, OBJ etc. Η ιδιότυπη βάση δεδομένων αποδίδεται οπτικά με δενδροειδή μορφή στο Alpheios. Η σύνταξη με τον τρόπο αυτό εκτός από το εκπαιδευτικό ενδιαφέρον ανοίγει ένα μονοπάτι στην ανάλυση των κειμένων, καθώς μπορεί κανείς να έχει στατιστικά στοιχεία για τη συντακτική θέση μιας λέξης.
https://github.com/balmas/tei-digital-age
Παρακάτω δείτε ένα δείγμα από τη δημιουργία ενός Treebank. Τι είναι το Treebank; Η γνωστή μας συντακτική ανάλυση αποδίδεται σε γλώσσα σήμανσης XML με ετικέτες και προσδιορισμούς, όπως ADV, OBJ etc. Η ιδιότυπη βάση δεδομένων αποδίδεται οπτικά με δενδροειδή μορφή στο Alpheios. Η σύνταξη με τον τρόπο αυτό εκτός από το εκπαιδευτικό ενδιαφέρον ανοίγει ένα μονοπάτι στην ανάλυση των κειμένων, καθώς μπορεί κανείς να έχει στατιστικά στοιχεία για τη συντακτική θέση μιας λέξης.
0 σχόλια:
Δημοσίευση σχολίου