Video

gllm-docproc | Tutorial : Video Loader | Use Case: Advanced DPO Pipeline | API Reference

Video Loader is designed for extracting information from Video file.

Prerequisites

This example specifically requires completion of all setup steps listed on the Prerequisites page.

Installation

# you can use a Conda environment
pip install --extra-index-url https://oauth2accesstoken:$(gcloud auth print-access-token)@glsdk.gdplabs.id/gen-ai-internal/simple/ "gllm-docproc[video]"

# you can use a Conda environment
$token = (gcloud auth print-access-token)
pip install --extra-index-url "https://oauth2accesstoken:$token@glsdk.gdplabs.id/gen-ai-internal/simple/" "gllm-docproc[video]"

# you can use a Conda environment
FOR /F "tokens=*" %T IN ('gcloud auth print-access-token') DO SET TOKEN=%T
pip install --extra-index-url "https://oauth2accesstoken:%TOKEN%@glsdk.gdplabs.id/gen-ai-internal/simple/" "gllm-docproc[video]"

You can use the following as a sample file: video-example.mp4.

Video Transcript Loader

VideoTranscriptLoader is responsible to extract information from video file by utilizing the GLLM Multimodal Audio to Text.

Create a script called main.py:

from gllm_docproc.loader.video import VideoTranscriptLoader

source = "./data/source/video-example.mp4"

# initialize video transcript loader
loader = VideoTranscriptLoader()

# load video file
loaded_elements = loader.load(source)

Run the script:

python main.py

The loader will generate the following: output JSON.

PreviousTXT NextXLSX

Last updated 1 month ago

Was this helpful?

hashtagInstallation

hashtagVideo Transcript Loader

Installation

Video Transcript Loader