Οι ερευνητές της Samsung AI Center αναπτύσσουν κινούμενα avatars από μια εικόνα!
Με την ονομασία MegaPortraits, η ομάδα της Samsung AI Center, λέει ότι μπορεί να δημιουργήσει avatar μεγέθους ενός megapixel από απλές εικόνες.
Η ομάδα έχει αναπτύξει πειστικά neural avatars ιστορικών προσώπων και ορισμένων σύγχρονων διασημοτήτων. Η διαδικασία ξεκινάει από ένα παρεχόμενο αρχείο, το οποίο είναι ένα βίντεο ενός ατόμου που κάνει διαφορετικές εκφράσεις του προσώπου και κινήσεις. Στη συνέχεια, οι κινήσεις και εκφράσεις εφαρμόζονται σε μια στατική εικόνα, όπως ένα ζωγραφισμένο πορτρέτο ή φωτογραφία, και το σύστημα τεχνητής νοημοσύνης, μετατρέπει τη στατική εικόνα σε ένα motion graphic (γραφικό κίνησης), όπου το κεφάλι και το πρόσωπο του θέματος αντιστοιχούν στις κινήσεις του αρχικού παρεχόμενου αρχείου.
Η παραπάνω εικόνα παρουσιάζει μια επισκόπηση του βασικού μοντέλου λειτουργίας της τεχνολογίας της ομάδας της Samsung AI Center. Πρόκειται για μια διαδικασία κωδικοποίησης της εμφάνισης του αρχικού αρχείου της πηγής. Για να κωδικοποιηθεί η εμφάνιση, η ομάδα χρησιμοποιεί ογκομετρικά χαρακτηριστικά και ένα σύστημα καθολικής περιγραφής από την εικόνα της πηγής, μέσω ενός κωδικοποιητή εμφάνισης Eapp. Παράλληλα, προβλέπουν τις αναπαραστάσεις κίνησης τόσο από την πηγή όσο και από το παρεχόμενο αρχείο χρησιμοποιώντας έναν κωδικοποιητή κίνησης Emtn.
Στη συνέχεια όλες αυτές οι αναπαραστάσεις κίνησης χρησιμοποιούνται για την πρόβλεψη των τρισδιάστατων παραμορφώσεων, και γίνεται η αντιστοίχιση στην εικόνα πηγής, με αποτέλεσμα να έχουμε το τελικό animated neural avatar. Αυτό που κάνει το σύστημα να ξεχωρίζει είναι το γεγονός ότι μπορεί να δημιουργηθεί ένα κινούμενο avatar χρησιμοποιώντας μια απλή εικόνα. Τα κινούμενα πορτρέτα ανάλυσης ενός megapixel, ονομάζονται MegaPortraits. Δείτε 2 παραδείγματα παρακάτω:
Η ομάδα της Samsung AI Center, πιστεύει ότι είναι η πρώτη που επιτυγχάνει την εντυπωσιακή ανάλυση του ενός megapixel. Ωστόσο, το σύστημα έχει δύο βασικούς περιορισμούς. Πρώτον, τα σύνολα δεδομένων που χρησιμοποιούνται περιλαμβάνουν κυρίως μετωπικές ή σχεδόν μετωπικές όψεις. Στην περίπτωση της χρήσης μη μετωπικών στάσεων κεφαλιού, υπάρχει μείωση της ποιότητας στο αποτέλεσμα. Ο δεύτερος περιορισμός είναι το τρεμόπαιγμα (flickering) στα αποτελέσματα, όπως φαίνεται στο παραπάνω βίντεο. Αυτό το τρεμόπαιγμα οφείλεται στο ότι οι εικόνες υψηλής ανάλυσης περιορίζονται στη στατική προβολή.
Η ερευνητική ομάδα πίσω από το πρότζεκτ αυτό, περιλαμβάνει τους: Nikita Drobyshev, Jenya Chelishev, Taras Khakhulin, Aleksei Ivakhenko, Victor Lempitsky και Egor Zakharov. Μπορείτε να διαβάσετε περισσότερα για τα MegaPortraits εδώ.
Αναζητήστε όλα τα νέα προϊόντα στο κατάστημα
Ρεπέλλα Φωτογραφικά.
To pttlgr στηρίζεται για την λειτουργία του στους αναγνώστες του!
Μπορείς να βοηθήσεις με μία μικρή δωρεά!
Υποστηρίξτε το pttlgr ακόμα και με μόλις 1€ – χρειάζεται μόνο ένα λεπτό. Εάν μπορείτε, σκεφτείτε να μας υποστηρίξετε με ένα ποσό κάθε μήνα.
Σας ευχαριστούμε.
Στηρίξτε το pttlgr και την προσπάθεια μας για έγκυρη και άμεση ενημέρωση ακολουθώντας μας
σε Instagram, YouTube και Facebook!
Ακολουθήστε το pttlgr στα Google News, εδώ!
Πριν φύγετε δείτε
- Canon: Έδωσε το πράσινο φως στη Sigma για 6 νέους RF φακούς!
- A24: Κατηγορείται για χρήση AI εικόνων σε πόστερ της ταινίας Civil War!
- Αυτή η κάμερα μεταφράζει τις φωτογραφίες σε ποιήματα!
- Pergear: Κυκλοφόρησε ο νέος φακός 25mm f/1.7 με τιμή 72 ευρώ!
- Fujifilm XApp: Αναβαθμίστηκε και προσφέρει μεταφορά Raw αρχείων στο smartphone σου!
- Έρχεται η νέα Fujifilm X-T50;