Microsoft VASA-1: Μετατρέπει εικόνα του προσώπου ενός ατόμου σε βίντεο που μιλάει ή τραγουδάει!
Η Microsoft αποκάλυψε το VASA-1, ένα νέο λογισμικό τεχνητής νοημοσύνης που παράγει ρεαλιστικό deepfake βίντεο από μια εικόνα προσώπου.
Αγριεύουν τα πράγματα! Το VASA-1 (Visual Affective Skills Audio) είναι ένα νέο ισχυρό μοντέλο τεχνητής νοημοσύνης της Microsoft που φιλοδοξεί να φέρει τα πάνω κάτω. Μπορεί και παράγει απίστευτα ρεαλιστικά deepfake βίντεο από μια μόνο φωτογραφία με το πρόσωπο ενός ανθρώπου. Και μάλιστα, με μια σύντομη ηχογράφηση της φωνής του συγκεκριμένου ατόμου παράγει και ρεαλιστικό ήχο! Η ικανότητα του VASA-1 να μιμείται τις φυσικές κινήσεις του κεφαλιού σε συνδυασμό με την προσομοίωση μιας μεγάλης γκάμας συναισθημάτων είναι απαράμιλλη και αποδεικνύει το πόσο γρήγορα “τρέχουν” οι εξελίξεις στην τεχνολογία. Να αναφέρουμε ότι η συγκεκριμένη τεχνολογία είναι ακόμη στο στάδιο ανάπτυξης, αλλά ήδη τα αποτελέσματα είναι τρομακτικά. Δείτε για παράδειγμα τη Mona Lisa να “ραπάρει”:
Microsoft just dropped VASA-1.
— Min Choi (@minchoi) April 18, 2024
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
Όσο αφορά τον ρεαλισμό, δείτε το παρακάτω παράδειγμα:
2. Realism and liveliness – example 1 pic.twitter.com/Kz0Bm2NRNy
— Min Choi (@minchoi) April 18, 2024
Η Microsoft παρουσίασε το VASA-1 χρησιμοποιώντας τα μοντέλα DALL-E 3 και StyleGAN2 για τη δημιουργία προσώπων τεχνητής νοημοσύνης, αλλά η εταιρία λέει ότι θα μπορούσαν να χρησιμοποιηθούν και πραγματικές φωτογραφίες ανθρώπων και προσθέτει το εξής:
Η έρευνά μας επικεντρώνεται στη δημιουργία οπτικών συναισθηματικών δεξιοτήτων για εικονικά avatars τεχνητής νοημοσύνης με στόχο τις θετικές εφαρμογές και δεν προορίζεται για τη δημιουργία περιεχομένου που χρησιμοποιείται για παραπλάνηση ή εξαπάτηση.
Ωστόσο, έχουμε δει στο παρελθόν παρόμοιες δηλώσεις περί ασφαλούς χρήσης τεχνητής νοημοσύνης αλλά στη συνέχεια υπήρξαν πολλά περιστατικά κακόβουλης χρήσης. Η Microsoft τονίζει ότι είναι αντίθετη σε οποιαδήποτε συμπεριφορά που περιλαμβάνει δημιουργία παραπλανητικού ή επιβλαβούς περιεχομένου πραγματικών προσώπων.
Ενδιαφερόμαστε να εφαρμόσουμε την τεχνική μας για την προώθηση της ανίχνευσης πλαστογραφίας. Προς το παρόν, τα βίντεο που δημιουργούνται με αυτήν τη μέθοδο εξακολουθούν να περιέχουν ατέλειες και η αριθμητική ανάλυση δείχνει ότι υπάρχει ακόμα δρόμος μέχρι να επιτευχθεί η αυθεντικότητα των πραγματικών βίντεο.
Μπορείτε να δείτε αν θέλετε περισσότερα παραδείγματα του μοντέλου VASA-1 της Microsoft εδώ.
Αναζητήστε όλα τα νέα προϊόντα στο κατάστημα
Ρεπέλλα Φωτογραφικά.
To pttlgr στηρίζεται για την λειτουργία του στους αναγνώστες του!
Μπορείς να βοηθήσεις με μία μικρή δωρεά!
Υποστηρίξτε το pttlgr ακόμα και με μόλις 1€ – χρειάζεται μόνο ένα λεπτό. Εάν μπορείτε, σκεφτείτε να μας υποστηρίξετε με ένα ποσό κάθε μήνα.
Σας ευχαριστούμε.
Στηρίξτε το pttlgr και την προσπάθεια μας για έγκυρη και άμεση ενημέρωση ακολουθώντας μας
σε Instagram, YouTube και Facebook!
Ακολουθήστε το pttlgr στα Google News, εδώ!
Πριν φύγετε δείτε
- Viltrox: Έρχονται άλλοι 3 “LAB” φακοί μέσα στο 2025!
- Λος Άντζελες: Πλάνα από drones δείχνουν τις καταστροφικές συνέπειες των πυρκαγιών!
- LG: Παρουσίασε την πρώτη οθόνη με ανάλυση 6K και Thunderbolt 5!
- Εικόνα του Street View βοήθησε στον εντοπισμό γυναίκας που είχε εξαφανιστεί!
- Dark Energy Camera: Εκπληκτική εικόνα ενός τεράστιου συμπλέγματος γαλαξιών!
- Meta: Θα αρχίσετε να βλέπετε AI εκδοχές του εαυτού σας!