glm-vision

Name: glm-vision
Availability: InStock
Author: archibate

Community

Analyze images with GLM-4.6V multimodal vision.

Data & Analytics #ocr #image-analysis #image-comparison #zhipu #glm-4.6v #multimodal-vision

Authorarchibate

Version1.0.0

Installs0

System Documentation

What problem does it solve?

Provides reliable visual understanding for user-submitted images by producing natural-language descriptions, extracting embedded text (OCR), identifying visual elements, and comparing multiple images to surface differences and semantics, which removes the need for manual inspection.

Core Features & Use Cases

Image Description: Generate concise and detailed natural-language descriptions for photos, screenshots, and diagrams.
OCR Text Extraction: Extract and preserve textual content from images for search, translation, or copyable output.
Image Comparison & Analysis: Compare multiple images to highlight differences, similar objects, or layout changes; supports basic video/frame input.
Use Case: Quickly analyze a screenshot to summarize UI elements and extract any visible text for documentation or bug reports.

Quick Start

Please analyze the attached image, describe its main contents, extract any visible text, and list the key objects and colors present.

glm-vision

System Documentation

What problem does it solve?

Core Features & Use Cases

Quick Start

Dependency Matrix

Required Modules

Components

💻 Claude Code Installation

Agent Skills Search Helper