Gemini 2.5 Flash Image: Το νέο μοντέλο εικόνας της Google που σοκάρει με τις δυνατότητες του

Η Google παρουσίασε το Gemini 2.5 Flash Image, ένα προηγμένο μοντέλο δημιουργίας και επεξεργασίας εικόνας που φέρνει νέες δυνατότητες για προγραμματιστές και δημιουργούς.
Το νέο μοντέλο επιτρέπει:
- Συγχώνευση πολλαπλών εικόνων σε μία, για πιο σύνθετες και ρεαλιστικές σκηνές.
- Διατήρηση συνέπειας χαρακτήρων, ώστε το ίδιο πρόσωπο ή αντικείμενο να εμφανίζεται με ακρίβεια σε διαφορετικά περιβάλλοντα ή γωνίες.
- Στοχευμένες επεξεργασίες με φυσική γλώσσα, όπως αφαίρεση αντικειμένων, αλλαγή χρωμάτων, προσθήκη εφέ ή αλλαγή στάσης ενός θέματος.
- Χρήση γνώσης του πραγματικού κόσμου, ώστε το μοντέλο να αναγνωρίζει αντικείμενα, διαγράμματα ή καταστάσεις με μεγαλύτερη ακρίβεια.

Τι νέο φέρνει
Η πρώτη έκδοση του Gemini 2.0 Flash ξεχώρισε για την ταχύτητα και το χαμηλό κόστος, αλλά υπήρχε ανάγκη για καλύτερη ποιότητα εικόνας και περισσότερη δημιουργική ελευθερία. Το Gemini 2.5 Flash Image έρχεται να καλύψει αυτό το κενό.
- Κάθε εικόνα κοστίζει περίπου 0,039 δολάρια (1290 output tokens), με συνολική τιμολόγηση στα 30 δολάρια ανά 1 εκατομμύριο output tokens.
- Είναι ήδη διαθέσιμο μέσω του Gemini API, του Google AI Studio για developers, και του Vertex AI για επιχειρήσεις.
- Όλες οι εικόνες που παράγονται ή επεξεργάζονται περιλαμβάνουν το αόρατο υδατογράφημα SynthID, ώστε να αναγνωρίζονται ως AI-generated.
Παραδείγματα χρήσης
Η Google παρουσίασε εφαρμογές-πρότυπα στο AI Studio:
- Δημιουργία φωτογραφικών template apps (π.χ. επεξεργασία προϊόντων, real estate listings, κάρτες προσωπικού).
- Photo editing app με δυνατότητες φυσικής γλώσσας (π.χ. “θόλωσε το φόντο”, “βγάλε έναν άνθρωπο από τη φωτογραφία”).
- Εκπαιδευτικό εργαλείο που αναγνωρίζει διαγράμματα και απαντά σε ερωτήσεις.
- Multi-image fusion για δημιουργία σκηνών με αντικείμενα από διαφορετικές εικόνες.
Συνεργασίες
Το μοντέλο είναι διαθέσιμο και μέσω OpenRouter.ai (με πρόσβαση σε 3 εκατ. developers) καθώς και μέσω fal.ai, επεκτείνοντας έτσι τη διαθεσιμότητά του σε ακόμη περισσότερους δημιουργούς.
Η Google δηλώνει ότι συνεχίζει να βελτιώνει το rendering μεγάλων κειμένων, τη συνέπεια χαρακτήρων και την ακρίβεια λεπτομερειών στις εικόνες.
Απέκτησε το Luminar με έκπτωση, με τον κωδικό pttl20,
κάνε κλικ στην εικόνα










