Generic Image Modality Transformer

Introduction

Generic Image Modality Transformer is a version of Image Modality Transformer that only use one converter and doesn't use any router.

Installation

# you can use a Conda environment
pip install --extra-index-url https://oauth2accesstoken:$(gcloud auth print-access-token)@glsdk.gdplabs.id/gen-ai-internal/simple/ "gllm-multimodal"

# you can use a Conda environment
$token = (gcloud auth print-access-token)
pip install --extra-index-url "https://oauth2accesstoken:$token@glsdk.gdplabs.id/gen-ai-internal/simple/" "gllm-multimodal"

Quickstart

Initialize the Generic Image Modality Transformer by passing the modality converter into it.

103KB

school_backpack.jpg

image

Open

import asyncio

from gllm_inference.schema import Attachment
from gllm_multimodal.modality_converter.image_to_text.image_to_caption import LMBasedImageToCaption
from gllm_multimodal.modality_transformer.image_modality_transformer.generic_image_modality_transformer import GenericImageModalityTransformer

image = Attachment.from_path("./school_backpack.jpg")

converter = LMBasedImageToCaption.from_preset("default")
transformer = GenericImageModalityTransformer(converter)
result = asyncio.run(transformer.transform(image.data, skip_routing=True))
print(result)

Output:

Ransel hitam serbaguna ini siap menemani petualangan harianmu dengan gaya.
Desain minimalis ransel hitam ini menampilkan tekstur kain yang elegan dan fungsional.
Nikmati kenyamanan dan ruang penyimpanan yang cukup dengan ransel modern berwarna hitam pekat ini.
Ransel klasik berwarna hitam dengan saku depan praktis dan tali bahu yang bisa diatur untuk berbagai kebutuhan.
Sempurnakan penampilanmu dengan ransel hitam stylish ini, pilihan tepat untuk segala aktivitas.

PreviousStandard Image Modality Transformer NextObservability

Last updated 2 months ago

Was this helpful?

hashtagIntroduction

hashtagInstallation

hashtagQuickstart

Introduction

Installation

Quickstart