Multimodal Language Models - a Ji-Xiang Collection

Ji-Xiang 's Collections

Docling

Reasoning models

1-bit Large Language Model (LLM)

Taiwanese Taigi Datasets

Image-Text-to-Text

Conversational Speech Model

Text Generation Inference

Video generation

Images Datasets

General screen parsing tool

Critique Fine-Tuning (CFT) Datasets

Reasoning datasets

Test-time scaling Datasets

Thinking/Reasoning Datasets

WebGPU

HTML to Markdown

Logical Reasoning Datasets

Multilingual-dataset

Object Detection

Retrieval-Augmented Generation (RAG) Dataset

Multilingual Large Language Models

Recommended Datasets

Multimodal Language Models

Traditional-chinese-dataset

Suggestion Models

Uncensored models

unfiltered dataset

Image Generator

Voice

Medical

Big Language Models

text-to-speech (TTS)

Visual Question Answering

Chat

Vision

ORPO-DPO datasets

SLM (small language models)

automatic speech recognition (ASR)

Vision-Language dataset

MoE

Dense Passage Retrieval (DPR) Datasets

background-removal

Extreme Quantization

Try on

Multimodal Language Models

updated 27 days ago