Το Meltemi είναι ένα σημαντικό βήμα στην ανάπτυξη της τεχνητής νοημοσύνης στην Ελλάδα. Πρόκειται για το πρώτο μεγάλο γλωσσικό μοντέλο (LLM) που έχει εκπαιδευτεί σε μεγάλο όγκο ελληνικού κειμένου.
Αυτό σημαίνει ότι μπορεί να κατανοήσει και να παράγει ελληνικό κείμενο με έναν τρόπο που μοιάζει ανθρώπινος.
Το Ινστιτούτο Γλώσσας και Επεξεργασίας Λόγου του Κέντρου Έρευνας και Καινοτομίας Αθηνά παρουσίασε το πρώτο ελληνικό Μεγάλο Γλωσσικό Μοντέλο (LLM), το Meltemi.
Το μοντέλο βασίζεται στο Mistral-7B.
Το Κέντρο Έρευνας Αθηνά είναι ένας οργανισμός Έρευνας και Ανάπτυξης στον τομέα της γλώσσας, των δημιουργικών τεχνολογιών και των ψηφιακών ανθρωπιστικών επιστημών στην Ελλάδα. Η εστίασή τους βρίσκεται στην προώθηση της επιστημονικής και τεχνολογικής έρευνας στις τεχνολογίες πληροφοριών, επικοινωνίας και γνώσης.
Το Ινστιτούτο εξηγεί ότι κατασκεύασαν μια τυποποιημένη σουίτα αξιολόγησης LLM για την ελληνική γλώσσα. Υπάρχουν δύο παραλλαγές του Meltemi στην έκδοση 1, και οι δύο κυκλοφορούν υπό την Άδεια Apache 2.0. Το θεμελιώδες μοντέλο είναι το Meltemi-7B-v1, το οποίο έχει περαιτέρω βελτιστοποιηθεί για συγκεκριμένες εργασίες με fine-tuning οδηγιών, και το Meltemi-7B-Instruct-v1 είναι ειδικά σχεδιασμένο για εφαρμογές συνομιλίας.
Τα μοντέλα εκπαιδεύτηκαν σε υποδομή AWS με υποστήριξη από επιχορήγηση GRNET, παρέχοντας υπηρεσίες δικτύωσης και cloud computing σε ακαδημαϊκά και ερευνητικά ιδρύματα.
Το έργο ηγείται ο Βασίλης Κατσούρος, Διευθυντής Έρευνας στο Ινστιτούτο Γλώσσας και Επεξεργασίας Λόγου για πάνω από 20 χρόνια.
Πώς λειτουργεί;
Όπως και άλλα μεγάλα γλωσσικά μοντέλα, βασίζεται σε νευρωνικά δίκτυα που έχουν εκπαιδευτεί σε τεράστιες ποσότητες δεδομένων. Αυτή η εκπαίδευση επιτρέπει στο μοντέλο να μάθει τις σχέσεις μεταξύ των λέξεων και να προβλέπει τις επόμενες λέξεις σε μια πρόταση. Αυτό του δίνει τη δυνατότητα να:
- Κατανοεί ερωτήσεις και εντολές στην ελληνική γλώσσα.
- Παράγει συνεκτικό και σχετικό κείμενο.
- Μεταφράζει κείμενα από και προς τα ελληνικά.
- Συμμετέχει σε συνομιλίες.
Ποια είναι τα πλεονεκτήματα του;
- Ελληνική γλώσσα: Το κύριο πλεονέκτημα του Meltemi είναι η ικανότητά του να χειρίζεται την ελληνική γλώσσα με υψηλή ακρίβεια.
- Ανοιχτός κώδικας: Το Meltemi είναι διαθέσιμο με ανοιχτό κώδικα, γεγονός που επιτρέπει σε ερευνητές και προγραμματιστές να το χρησιμοποιήσουν και να το βελτιώσουν.
- Πολλαπλές εφαρμογές: Το Meltemi μπορεί να χρησιμοποιηθεί σε μια ποικιλία εφαρμογών, όπως:
- Εξυπηρέτηση πελατών: Παροχή απαντήσεων σε συχνές ερωτήσεις.
- Εκπαίδευση: Δημιουργία εξατομικευμένου εκπαιδευτικού υλικού.
- Μετάφραση: Μετάφραση κειμένων από και προς τα ελληνικά.
- Δημιουργία περιεχομένου: Γράψιμο άρθρων, ποιημάτων κ.λπ.
Ποια είναι η διαφορά του από το ChatGPT;
Το Meltemi και το ChatGPT είναι και τα δύο μεγάλα γλωσσικά μοντέλα, αλλά υπάρχουν κάποιες σημαντικές διαφορές:
- Γλώσσα: Το Meltemi είναι εξειδικευμένο στην ελληνική γλώσσα, ενώ το ChatGPT είναι εκπαιδευμένο σε πολλές γλώσσες.
- Ανοιχτός κώδικας: Το Meltemi είναι ανοιχτού κώδικα, ενώ το ChatGPT είναι κλειστού κώδικα.
- Εφαρμογές: Το Meltemi μπορεί να έχει πιο εξειδικευμένες εφαρμογές για την ελληνική γλώσσα.