Η nvidia αποκαλύπτει το GauGAN2, την τεχνητή νοημοσύνη που δημιουργεί εικόνες τρομακτικής ακρίβειας από κείμενο


Η nvidia αποκαλύπτει το GauGAN2, την τεχνητή νοημοσύνη που δημιουργεί εικόνες τρομακτικής ακρίβειας από κείμενο

Μια εικόνα αξίζει όσο χίλιες λέξεις λέει η γνωστή παροιμία αλλά τώρα χρειάζονται μόνο τρεις ή τέσσερις λέξεις για να δημιουργηθεί μία εικόνα.

Χάρη στο GauGAN2, την τελευταία έκδοση του demo λογισμικούς ζωγραφικής τεχνητής νοημοσύνης της NVIDIA Research ο δημιουργός μπορεί να περιγράψει μία εικόνα με λέξεις και αυτή να ζωντανέψει μπροστά στα μάτια του.

Το μοντέλο βαθιάς μάθησης πίσω από το GauGAN επιτρέπει σε οποιονδήποτε να διοχετεύσει τη φαντασία του σε φωτορεαλιστικές δημιουργίες — και είναι πιο εύκολο από ποτέ. Απλώς πληκτρολογήστε μια φράση όπως “ηλιοβασίλεμα σε παραλία” και η τεχνητή νοημοσύνη δημιουργεί τη σκηνή σε πραγματικό χρόνο. Προσθέστε ένα επιπλέον επίθετο όπως “ηλιοβασίλεμα σε βραχώδη παραλία” ή αλλάξτε το “ηλιοβασίλεμα” σε “απόγευμα” ή “βροχερή μέρα” και το μοντέλο, που βασίζεται σε τεχνητή νοημοσύνη, τροποποιεί αμέσως την εικόνα.

Η νέα δυνατότητα μετατροπής κειμένου σε εικόνα του GauGAN2 μπορεί πλέον να χρησιμοποιηθεί σε επιδείξεις NVIDIA AI , όπου οι επισκέπτες του ιστότοπου μπορούν να βιώσουν την τεχνητή νοημοσύνη μέσω των πιο πρόσφατων επιδείξεων της NVIDIA Research. Με την ευελιξία των μηνυμάτων κειμένου και των σκίτσων, το GauGAN2 επιτρέπει στους χρήστες να δημιουργούν και να προσαρμόζουν σκηνές πιο γρήγορα και με καλύτερο έλεγχο.

Το GauGAN2 συνδυάζει τη χαρτογράφηση τμηματοποίησης, τη ζωγραφική και τη δημιουργία κειμένου σε εικόνα σε ένα μόνο μοντέλο, καθιστώντας το ένα ισχυρό εργαλείο για τη δημιουργία φωτορεαλιστικής τέχνης με συνδυασμό λέξεων και σχεδίων.

Αντί να χρειάζεται να σχεδιάσουν κάθε στοιχείο μιας φανταστικής σκηνής, οι χρήστες μπορούν να εισάγουν μια σύντομη φράση για να δημιουργήσουν γρήγορα τα βασικά χαρακτηριστικά και το θέμα μιας εικόνας, όπως μια χιονισμένη οροσειρά. Αυτό το σημείο εκκίνησης μπορεί στη συνέχεια να προσαρμοστεί με σκίτσα για να κάνει ένα συγκεκριμένο βουνό ψηλότερο ή να προσθέσει μερικά δέντρα στο πρώτο πλάνο ή σύννεφα στον ουρανό.

Φανταστείτε, για παράδειγμα, να αναδημιουργείτε ένα τοπίο από τον εμβληματικό πλανήτη Tatooine στο franchise Star Wars , που έχει δύο ήλιους. Το μόνο που χρειάζεται είναι το κείμενο “Desert Hills Sun” για να δημιουργηθεί ένα σημείο εκκίνησης, μετά το οποίο οι χρήστες μπορούν να σχεδιάσουν γρήγορα έναν δεύτερο ήλιο.

Είναι μια επαναληπτική διαδικασία, όπου κάθε λέξη που πληκτρολογεί ο χρήστης στο πλαίσιο κειμένου προσθέτει περισσότερα στην εικόνα που έχει δημιουργηθεί με AI.

Το μοντέλο AI πίσω από το GauGAN2 εκπαιδεύτηκε σε 10 εκατομμύρια εικόνες τοπίων υψηλής ποιότητας χρησιμοποιώντας τον υπερυπολογιστή NVIDIA Selene , ένα σύστημα NVIDIA DGX SuperPOD που συγκαταλέγεται στους 10 πιο ισχυρούς υπερυπολογιστές στον κόσμο. Οι ερευνητές χρησιμοποίησαν ένα νευρωνικό δίκτυο που μαθαίνει τη σύνδεση μεταξύ των λέξεων και των οπτικών που αντιστοιχούν όπως «χειμώνας», «ομιχλώδης» ή «ουράνιο τόξο».

Σε σύγκριση με μοντέλα τελευταίας τεχνολογίας ειδικά για εφαρμογές κειμένου σε εικόνα ή τμηματοποίησης από χάρτη σε εικόνα, το νευρωνικό δίκτυο πίσω από το GauGAN2 παράγει μεγαλύτερη ποικιλία και υψηλότερη ποιότητα εικόνων.

Η επίδειξη της έρευνας GauGAN2 απεικονίζει τις μελλοντικές δυνατότητες για ισχυρά εργαλεία δημιουργίας εικόνων για καλλιτέχνες. Ένα παράδειγμα είναι η εφαρμογή NVIDIA Canvas , η οποία βασίζεται στην τεχνολογία GauGAN και είναι διαθέσιμη για λήψη για οποιονδήποτε διαθέτει GPU NVIDIA RTX.

Η NVIDIA Research έχει περισσότερους από 200 επιστήμονες σε όλο τον κόσμο, οι οποίοι επικεντρώνονται σε τομείς όπως η τεχνητή νοημοσύνη, τα αυτοκινούμενα αυτοκίνητα, η ρομποτική και τα γραφικά. 

Στηρίξτε το pttlgr και την προσπάθεια μας για έγκυρη και άμεση ενημέρωση ακολουθώντας μας
σε InstagramYouTube και Facebook!

Ακολουθήστε το pttlgr στα Google News, εδώ!

Δες την εβδομαδιαία μας φωτογραφική εκπομπή Angle of View στο YouTube ή άκουσε την ως Podcast σε Spotify, Google ή Apple!

Κάνε Εγγραφή / Subscribe στο κανάλι μας στο YouTube, αποκλειστικά για φωτογραφία και φωτογραφικό εξοπλισμό!

Πριν φύγετε δείτε

ΔΕΙΤΕ ΑΚΟΜΑ

Ετικέτες:

NVIDIA

Πηγή:

nvidia
author

Η ομάδα του pttlgr αποτελείται από φωτογράφους συντάκτες που αγαπούν την φωτογραφία και την ενημέρωση!

Ποιά είναι η γνώμη σου;

Σας παρακαλούμε να σχολιάζετε με σεβασμό στους συνομιλητές σας και να χρησιμοποιείτε την ελληνική γλώσσα και όχι greeklish (παρά μόνο στην περίπτωση που δεν μπορείτε λόγω ρυθμίσεων του Η/Υ). Επίσης αποφεύγετε να γράφετε τα σχόλια σας με κεφαλαία γράμματα. Όλα τα σχόλια περνάνε από έλεγχο πριν την δημοσίευση τους, οπότε πρέπει να περιμένετε για να εγκριθεί το σχόλιο σας.