Microsoft VASA-1: Μετατρέπει εικόνα του προσώπου ενός ατόμου σε βίντεο που μιλάει ή τραγουδάει!

Η Microsoft αποκάλυψε το VASA-1, ένα νέο λογισμικό τεχνητής νοημοσύνης που παράγει ρεαλιστικό deepfake βίντεο από μια εικόνα προσώπου.

Αγριεύουν τα πράγματα! Το VASA-1 (Visual Affective Skills Audio) είναι ένα νέο ισχυρό μοντέλο τεχνητής νοημοσύνης της Microsoft που φιλοδοξεί να φέρει τα πάνω κάτω. Μπορεί και παράγει απίστευτα ρεαλιστικά deepfake βίντεο από μια μόνο φωτογραφία με το πρόσωπο ενός ανθρώπου. Και μάλιστα, με μια σύντομη ηχογράφηση της φωνής του συγκεκριμένου ατόμου παράγει και ρεαλιστικό ήχο! Η ικανότητα του VASA-1 να μιμείται τις φυσικές κινήσεις του κεφαλιού σε συνδυασμό με την προσομοίωση μιας μεγάλης γκάμας συναισθημάτων είναι απαράμιλλη και αποδεικνύει το πόσο γρήγορα “τρέχουν” οι εξελίξεις στην τεχνολογία. Να αναφέρουμε ότι η συγκεκριμένη τεχνολογία είναι ακόμη στο στάδιο ανάπτυξης, αλλά ήδη τα αποτελέσματα είναι τρομακτικά. Δείτε για παράδειγμα τη Mona Lisa να “ραπάρει”:

Όσο αφορά τον ρεαλισμό, δείτε το παρακάτω παράδειγμα:

Η Microsoft παρουσίασε το VASA-1 χρησιμοποιώντας τα μοντέλα DALL-E 3 και StyleGAN2 για τη δημιουργία προσώπων τεχνητής νοημοσύνης, αλλά η εταιρία λέει ότι θα μπορούσαν να χρησιμοποιηθούν και πραγματικές φωτογραφίες ανθρώπων και προσθέτει το εξής:

Η έρευνά μας επικεντρώνεται στη δημιουργία οπτικών συναισθηματικών δεξιοτήτων για εικονικά avatars τεχνητής νοημοσύνης με στόχο τις θετικές εφαρμογές και δεν προορίζεται για τη δημιουργία περιεχομένου που χρησιμοποιείται για παραπλάνηση ή εξαπάτηση.

Ωστόσο, έχουμε δει στο παρελθόν παρόμοιες δηλώσεις περί ασφαλούς χρήσης τεχνητής νοημοσύνης αλλά στη συνέχεια υπήρξαν πολλά περιστατικά κακόβουλης χρήσης. Η Microsoft τονίζει ότι είναι αντίθετη σε οποιαδήποτε συμπεριφορά που περιλαμβάνει δημιουργία παραπλανητικού ή επιβλαβούς περιεχομένου πραγματικών προσώπων.

Ενδιαφερόμαστε να εφαρμόσουμε την τεχνική μας για την προώθηση της ανίχνευσης πλαστογραφίας. Προς το παρόν, τα βίντεο που δημιουργούνται με αυτήν τη μέθοδο εξακολουθούν να περιέχουν ατέλειες και η αριθμητική ανάλυση δείχνει ότι υπάρχει ακόμα δρόμος μέχρι να επιτευχθεί η αυθεντικότητα των πραγματικών βίντεο.

Μπορείτε να δείτε αν θέλετε περισσότερα παραδείγματα του μοντέλου VASA-1 της Microsoft εδώ.


Απέκτησε το Luminar με έκπτωση, με τον κωδικό pttl20,
κάνε κλικ στην εικόνα

Luminar - Λογισμικό Επεξεργασίας φωτογραφιών

Αναζητήστε όλα τα νέα προϊόντα στο κατάστημα
Ρεπέλλα Φωτογραφικά.

Σπανουδάκης Γιώργος

Είμαι ο Σπανουδάκης Γιώργος, φωτογράφος με έδρα την Αθήνα και έχω σπουδάσει μουσική και φωτογραφία (κάτοχος Bachelor of Arts). Ασχολούμαι επίσης με επεξεργασία φωτογραφιών και βίντεο. Εξειδικεύομαι σε φωτογραφίσεις κάθε είδους καλλιτεχνικών εκδηλώσεων και πορτρέτων. Όταν έχω χρόνο ασχολούμαι επίσης με αστροφωτογραφία, φωτογραφία τοπίου και λατρεύω να εκφράζομαι δημιουργώντας δικά μου φωτογραφικά concept.
0 0 ψήφοι
Article Rating
Εγγραφή
Ειδοποίηση για
guest

0 Comments
Παλαιότερο
Νεότερο Με τις περισσότερες ψήφους
Inline Feedbacks
Προβολή όλων των σχολίων
Back to top button
0
Would love your thoughts, please comment.x
Close

Η διαφήμιση στηρίζει το pttlgr

Οι διαφημίσεις μάς βοηθούν να διατηρούμε το pttlgr δωρεάν, ανεξάρτητο και καθημερινά ενημερωμένο για φωτογράφους, βιντεογράφους και δημιουργούς εικόνας.
Αν θέλεις, μπορείς να μας προσθέσεις στις εξαιρέσεις του ad blocker σου.

Σε ευχαριστούμε για τη στήριξη!