HealthGPT

by Zhejiang University, University of Electronic Science and Technology, Alibaba

HealthGPT is a medical visual language model for medical image analysis, diagnosis assistance, and text generation.

What is HealthGPT?

HealthGPT is an advanced medical visual language model (Med-LVLM) developed by Zhejiang University, University of Electronic Science and Technology, and Alibaba. It integrates visual comprehension and generation tasks using Heterogeneous Low-Rank Adaptation (H-LoRA) technology, enabling efficient medical image analysis, diagnostic assistance, and text generation.

Main Features of HealthGPT

Medical Image Analysis and Diagnostic Assistance: Processes medical images (e.g., X-rays, CT scans) to assist in diagnosis.
Visual Question Answering: Answers questions based on medical images, explaining abnormalities or lesions.
Medical Text Generation: Generates medical texts like diagnostic reports and summaries.
Multimodal Fusion: Combines visual and textual information for comprehensive medical understanding.
Personalized Treatment Plans: Generates tailored treatment plans based on patient data.

Technical Principles

Heterogeneous Low-Rank Adaptation (H-LoRA): Separates visual understanding and generation tasks to avoid conflicts.
Hierarchical Visual Perception (HVP): Handles different visual granularity requirements efficiently.
Three-Stage Learning Strategy (TLS): Enables quick adaptation to various medical tasks.

Application Scenarios

Medical Image Generation: Generates high-quality medical images for diagnosis and research.
Medical Education and Research: Assists in teaching and research by analyzing medical data.
Smart Health Assistant: Provides health data queries and daily health management suggestions.

Project Resources

Project Website: https://llsuzy.github.io/HealthGPT.github.io/
GitHub Repository: https://github.com/DCDmllm/HealthGPT
HuggingFace Model Library: https://huggingface.co/lintw/HealthGPT-M3
arXiv Technical Paper: https://arxiv.org/pdf/2502.09838

Model Capabilities

Model Type

multimodal

Supported Tasks

Medical Image Analysis Diagnostic Assistance Visual Question Answering Medical Text Generation Multimodal Fusion Personalized Treatment Planning

Usage & Integration

Pricing

free

License

Open Source

Screenshots & Images

Primary Screenshot

Additional Images

Try Now View Demo Documentation

Stats

457 Views

0 Favorites

Community & Support

GitHub Repository

Similar Models

Ola by Tsinghua University, Tencent Hunyuan Research Team, NUS S-Lab

627

Zonos by Zyphra

516

Step-Video-T2V by Leapfrogging Star

639

HealthGPT

What is HealthGPT?

Main Features of HealthGPT

Technical Principles

Application Scenarios