Nowa era możliwości dla deweloperów

Od premiery Gemini 1.0 w grudniu zeszłego roku miliony deweloperów wykorzystały Google AI Studio i Vertex AI, aby tworzyć aplikacje w 109 językach. Teraz, dzięki premierze Gemini 2.0 Flash Experimental, otwierają się jeszcze bardziej interaktywne i immersyjne możliwości, a także narzędzia wspierające programistów w codziennej pracy.

Nowości Gemini 2.0 Flash

Lepsza wydajność

Gemini 2.0 Flash jest dwa razy szybszy od poprzedniej wersji 1.5 Pro, oferując jeszcze lepszą wydajność w przetwarzaniu tekstu, kodu, obrazu oraz danych przestrzennych. Nowa wersja wprowadza również udoskonalone zrozumienie przestrzenne, pozwalające dokładniej identyfikować małe obiekty w zatłoczonych obrazach.

Nowe tryby wyjściowe

Deweloperzy mogą teraz generować odpowiedzi zawierające tekst, dźwięk i obrazy w jednym wywołaniu API. Wprowadzone niewidzialne znaki wodne SynthID w treściach wizualnych i audio pomagają zmniejszyć ryzyko dezinformacji.

  • Wyjście audio w wielu językach: Gemini 2.0 umożliwia precyzyjne sterowanie treścią i stylem wypowiedzi w 8 głosach wysokiej jakości.
  • Wyjście obrazów: Nowa funkcja pozwala generować i edytować obrazy w wieloetapowych rozmowach, idealne do multimodalnych aplikacji, takich jak przepisy kulinarne.

Wykorzystanie narzędzi natywnych

Gemini 2.0 Flash obsługuje narzędzia, takie jak Google Search i funkcje wykonywania kodu, co umożliwia lepsze tworzenie doświadczeń opartych na działaniach AI. Wyszukiwanie równoległe zapewnia szybsze i dokładniejsze pozyskiwanie informacji z wielu źródeł.

Multimodal Live API

Dzięki tej funkcji deweloperzy mogą tworzyć aplikacje działające w czasie rzeczywistym z danymi wideo i audio. API obsługuje naturalne wzorce konwersacyjne, takie jak przerwania i wykrywanie aktywności głosowej, co otwiera nowe możliwości dla bardziej złożonych przypadków użycia.

Kodowanie z AI: Nowy poziom automatyzacji

Agenci kodowania w akcji

Gemini 2.0 Flash wprowadza Julesa, eksperymentalnego agenta kodowania wspieranego AI. Jules integruje się z GitHub, naprawiając błędy i automatyzując żmudne zadania programistyczne. Agent potrafi planować wieloetapowe poprawki, edytować wiele plików i tworzyć pull requesty.

Innowacje dla startupów i deweloperów

Już teraz Gemini 2.0 Flash jest wykorzystywany przez startupy do prototypowania takich funkcji jak:

  • Wirtualne postacie i narracje audio,
  • Tłumaczenia kontekstowe w wielu językach,
  • Analiza wideo i eksploracja danych przestrzennych na stronach internetowych

Aby ułatwić start, Google AI Studio udostępnia otwarte źródła kodu i aplikacje startowe.