Τα μέσα κοινωνικής δικτύωσης, όπως το TikTok και το Reddit, πλημμυρίζουν με αναρτήσεις χρηστών που ισχυρίζονται ότι κερδίζουν 20 δολάρια την ώρα ή και περισσότερα ολοκληρώνοντας μικρές εργασίες στον ελεύθερο χρόνο τους σε ιστοσελίδες όπως οι DataAnnotation.tech, Taskup.ai, Remotasks και Amazon Mechanical Turk.
Καθώς οι εταιρείες σπεύδουν να αναπτύξουν μοντέλα τεχνητής νοημοσύνης (ΤΝ), αυξάνεται η ζήτηση για εργασίες “σημειοδότησης δεδομένων” και “ετικέτας δεδομένων”. Οι εργαζόμενοι ολοκληρώνουν εργασίες όπως γραφή και κώδικα, τις οποίες στη συνέχεια χρησιμοποιούν οι εταιρείες τεχνολογίας για να αναπτύξουν συστήματα τεχνητής νοημοσύνης, τα οποία εκπαιδεύονται χρησιμοποιώντας μεγάλο αριθμόδειγματοληπτικών σημείων δεδομένων. Ορισμένα μοντέλα απαιτούν όλα τα δεδομένα εισαγωγής τους να επισημαίνονται από ανθρώπους, μια τεχνική που αναφέρεται ως “εποπτευόμενη μάθηση”. Ενώ η “μη εποπτευόμενη μάθηση”, στην οποία τα μοντέλα ΤΝ τροφοδοτούνται με μη επισημασμένα δεδομένα, γίνεται όλο και πιο δημοφιλής, τα συστήματα ΤΝ που εκπαιδεύονται με μη εποπτευόμενη μάθηση εξακολουθούν συχνά να απαιτούν ένα τελικό βήμα που περιλαμβάνει δεδομένα με ετικέτες από ανθρώπους.
Δεν υπάρχουν ακριβείς εκτιμήσεις για τον αριθμό των ατόμων που ασχολούνται με την εργασία με ετικέτες δεδομένων. Ένα ερευνητικό άρθρο της Google το 2022 υπολογίζει τον αριθμό σε εκατομμύρια, και αυτός μπορεί να αυξηθεί σε δισεκατομμύρια στο μέλλον. Μια μελέτη του 2021 εκτιμά ότι 163 εκατομμύρια άνθρωποι έχουν δημιουργήσει προφίλ σε διαδικτυακές πλατφόρμες εργασίας, εκ των οποίων τα 14 εκατομμύρια έχουν βρει εργασία μέσω της πλατφόρμας τουλάχιστον μία φορά και τα 3,3 εκατομμύρια έχουν ολοκληρώσει τουλάχιστον 10 έργα ή έχουν κερδίσει τουλάχιστον 1.000 δολάρια. (Αν και αυτός ο αριθμός είναι πιθανό να είναι υπερεκτίμηση για την εργασία με ετικέτες δεδομένων, επειδή δεν είναι όλες οι εργασίες που εκτελούνται σε διαδικτυακές πλατφόρμες εργασίας εργασίες με ετικέτες δεδομένων.)
Οι ιστοσελίδες με ετικέτες δεδομένων, που συχνά αποτελούν θυγατρικές μεγαλύτερων εταιρειών, μπορούν να προσφέρουν νόμιμους τρόπους για να κερδίσετε χρήματα. Καθώς η βιομηχανία ΤΝ συνεχίζει να αναπτύσσεται, η ζήτηση για ανθρώπους που βάζουν ετικέτες έχει αυξηθεί μαζί της. Ωστόσο, οι εν δυνάμει χρήστες πρέπει να γνωρίζουν ότι ο κλάδος της σήμανσης δεδομένων δεν είναι επαρκώς ρυθμισμένος, και επειδή ο κλάδος είναι αδιαφανής, μπορεί να είναι δύσκολο να πλοηγηθείτε σε αυτόν.
Ακολουθούν ορισμένα πράγματα που πρέπει να γνωρίζετε:
- Πώς ξεκινά κάποιος να εργάζεται με ετικέτες δεδομένων;
Για να μπορέσουν να συμμετάσχουν στα προγράμματα, οι εργαζόμενοι πρέπει να ξεκινήσουν ολοκληρώνοντας μια αξιολόγηση. Η διάρκεια της αρχικής αξιολόγησης μπορεί να διαφέρει, αλλά οι χρήστες αναφέρουν συνήθως χρόνους από μία ώρα έως και τρεις ώρες. Εάν ένας χρήστης περάσει την αξιολόγηση, θα πρέπει να αρχίσει να λαμβάνει προσκλήσεις για αμειβόμενη εργασία μέσω του ιστότοπου. Εάν ο χρήστης δεν γίνει δεκτός στο πρόγραμμα, συνήθως δεν λαμβάνει καμία ενημέρωση μετά την ολοκλήρωση της αξιολόγησης.
Οι εργασίες στην αξιολόγηση μπορεί να διαφέρουν πολύ μεταξύ τους. Υπάρχει μια τάση προς εργασίες με ετικέτες δεδομένων που απαιτούν υψηλότερες δεξιότητες, λέει η Sonam Jindal, η οποία ηγείται του προγράμματος AI, Εργασία και Οικονομία στο Partnership on AI, έναν μη κερδοσκοπικό οργανισμό. “Θα αρχίσουμε να το βλέπουμε αυτό καθώς αυξάνεται η ανάγκη για μοντέλα ΤΝ υψηλότερης ποιότητας, χρειάζεστε επίσης δεδομένα υψηλότερης ποιότητας”, λέει. “Μπορούμε να καταλάβουμε αν κάτι είναι γάτα ή σκύλος, πολύ ωραία. Προχωρώντας σε πιο σύνθετες εργασίες – για να έχουμε πιο προηγμένη ΤΝ που είναι χρήσιμη σε πιο εξειδικευμένα σενάρια πραγματικού κόσμου – θα χρειαστείτε πιο εξειδικευμένα σύνολα δεξιοτήτων για αυτό.”
- Πόσα χρήματα αποδίδει η εργασία αυτή;
Στις ΗΠΑ, οι ιστότοποι προσφέρουν συχνά περίπου 20 $ την ώρα για εργασίες όπως η επισήμανση φωτογραφιών και η ολοκλήρωση ασκήσεων γραφής. Οι πιο εξειδικευμένες εργασίες με ετικέτες δεδομένων μπορούν να προσφέρουν υψηλότερες απολαβές. Για παράδειγμα, το DataAnnotation.tech προσφέρει 40 $ για εργασίες κωδικοποίησης και το Outlier.ai προσφέρει 60 $ την ώρα για εργασίες χημείας.
Εκτός των ΗΠΑ, οι ετικετέτες δεδομένων συνήθως πληρώνονται πολύ λιγότερο, λέει η Jindal. Αλλά παρά την υψηλότερη τιμή, υπάρχουν λόγοι για τους οποίους οι εταιρείες μπορεί να προτιμούν εργαζόμενους με έδρα τις ΗΠΑ, όπως εργασίες που απαιτούν συγκεκριμένες πολιτισμικές γνώσεις ή δεξιότητες που επικρατούν στις ΗΠΑ.