Οι Amazon, Meta, Microsoft, Mistral και Perplexity υπέγραψαν συμφωνία με το Wikimedia Foundation, βάσει της οποίας οι εταιρείες θα πληρώνουν για τη χρήση περιεχομένου της Wikipedia.
Επί της ουσίας, η διαδικασία έχει ως εξής: Οι εταιρείες τεχνητής νοημοσύνης αποκτούν πρόσβαση σε επί πληρωμή API, ώστε να μπορούν να αξιοποιούν τα μεγάλα γλωσσικά μοντέλα τους το περιεχόμενο του ιστότοπου.
Τι προβλέπει η συμφωνία
Το Wikimedia Foundation το αναφέρει σε ανάρτηση στο blog, αν και φαίνεται πως η συμφωνία με ορισμένες από τις εταιρείες είχε ήδη στηθεί (τουλάχιστον εν μέρει) μέσα στον τελευταίο χρόνο.
Με βάση τη συμφωνία, οι εταιρείες θα χρησιμοποιούν την επί πληρωμή API της Wikipedia.
Τι είναι το Wikimedia Enterprise και η επί πληρωμή API (από το 2021)
Η επί πληρωμή API υπάρχει από το 2021. Τότε, το Wikimedia Foundation (ο οργανισμός πίσω από τη Wikipedia) δημιούργησε μια εμπορική υπηρεσία: το Wikimedia Enterprise.
Η υπηρεσία αυτή προσφέρει επί πληρωμή πρόσβαση στην εγκυκλοπαίδεια μέσω API, επιτρέποντας σε εταιρείες και οργανισμούς να αντλούν και να ενσωματώνουν περιεχόμενο πιο εύκολα και σε μεγάλη κλίμακα.
Πόσα χρήματα εμπλέκονται;
Το Wikimedia Enterprise δεν αναφέρει πόσα χρήματα περιλαμβάνει η συμφωνία. Ο οργανισμός δεν δημοσιοποιεί ποτέ την τιμή της API και καθορίζει τα ποσά ανά συνεργάτη. Επίσης, δεν δίνει άλλες λεπτομέρειες για τη συνεργασία.
Σύμφωνα με το Wikimedia, «η συνεργασία βοηθά το έργο των διεθνών εθελοντών να φτάσει σε δισεκατομμύρια ανθρώπους».
Μήπως η συμφωνία έρχεται αργά;
Το ερώτημα είναι αν η συμφωνία έρχεται πολύ αργά. Τα μεγάλα γλωσσικά μοντέλα χρησιμοποιούν εδώ και χρόνια περιεχόμενο της Wikipedia και, καταρχάς, αυτό επιτρέπεται από την άδεια χρήσης της εγκυκλοπαίδειας.
Εν τούτοις, αυτό αρχίζει να δημιουργεί προβλήματα για τη Wikipedia.
Πέρσι, ο ιστότοπος είδε μεγάλη μείωση της επισκεψιμότητας και απέδωσε την αιτία σε μοντέλα AI. Τότε, η Wikipedia ζήτησε από τις τεχνολογικές εταιρείες να πληρώνουν για τη χρήση της πληροφορίας.
Ποιοι πληρώνουν ήδη και ποιοι έχουν δωρεάν πρόσβαση;
Άλλες εταιρείες το κάνουν ήδη: Google, Ecosia και ορισμένες μικρότερες εταιρείες AI χρησιμοποιούν την API εδώ και περισσότερο καιρό. Το Wikimedia Enterprise έχει διαθέσει την πρόσβαση δωρεάν και στο The Internet Archive.
Τι σημαίνει αυτό για AI, Wikipedia και «ανοιχτή γνώση»
Η συμφωνία δείχνει ότι περνάμε από το «η πληροφορία είναι διαθέσιμη» στο «η μαζική, βιομηχανική αξιοποίηση της πληροφορίας έχει κόστος και κανόνες».
Η Wikipedia παραμένει ένα οικοσύστημα που βασίζεται σε εθελοντές, αλλά η ζήτηση από την AI αυξάνει τις υποδομές (servers, bandwidth, προστασία από scraping) και αυτό πρέπει κάπως να χρηματοδοτηθεί.
Λιγότερο scraping, πιο σταθερή πρόσβαση
Ένα πρακτικό όφελος των επί πληρωμή API είναι ότι περιορίζουν το ανεξέλεγκτο scraping. Αντί οι εταιρείες να «τραβούν» σελίδες με αυτοματισμούς που πιέζουν την υποδομή, μια API:
- δίνει δομημένα δεδομένα,
- μειώνει τα σφάλματα/διπλοεγγραφές,
- επιτρέπει καλύτερο rate limiting και παρακολούθηση χρήσης.
Άδειες, απόδοση και το ζήτημα της πηγής
Το περιεχόμενο της Wikipedia διατίθεται συνήθως με άδειες τύπου Creative Commons (π.χ. CC BY-SA), που απαιτούν απόδοση (attribution) και, σε κάποιες περιπτώσεις, διατήρηση των ίδιων όρων (share-alike).
Στην πράξη, πολλές απαντήσεις AI δεν εμφανίζουν καθαρά την πηγή. Μια εμπορική συμφωνία μπορεί να ενισχύσει καλύτερες πρακτικές, όπως:
- εμφανή παραπομπή στο λήμμα,
- σύνδεση στη συγκεκριμένη έκδοση/αναθεώρηση,
- σαφή επισήμανση ότι το περιεχόμενο είναι σύνοψη.
Επισκεψιμότητα και βιωσιμότητα της Wikipedia
Αν οι χρήστες παίρνουν απαντήσεις από chatbot αντί να επισκέπτονται τη Wikipedia, μειώνεται:
- η επισκεψιμότητα,
- η αναγνωρισιμότητα του έργου των εθελοντών,
- δυνητικά και οι δωρεές.
Η πληρωμένη πρόσβαση από εταιρείες AI μπορεί να λειτουργήσει ως μηχανισμός «αντιστάθμισης» για τη μετατόπιση της αξίας από το site προς τα προϊόντα AI.
Τι να περιμένουμε από εδώ και πέρα
Κρίσιμα ερωτήματα για το μέλλον είναι: θα υπάρξει περισσότερη διαφάνεια στις χρεώσεις; θα προστατεύεται η ανοιχτή πρόσβαση για ερευνητές/εκπαιδευτικά ιδρύματα; και θα βελτιωθεί ουσιαστικά η απόδοση πηγών στα AI αποτελέσματα; Αυτά θα κρίνουν αν το μοντέλο συνεργασίας ενισχύει την ανοιχτή γνώση ή δημιουργεί νέες ανισορροπίες.
