ConvNext_Multi ๋ชจ๋ธ ์นด๋
_Last updated: 2025-09-25 08:56:58
์ต์ ์ ๋ฐ์ดํธ ๋ด์ญ
ํต์ฌ ์์ ์ฌํญ: ๋ง๋ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋ํด ์ํ ์์ก ๋จ๊ณ๋ณ ์คํํธ๋ผ ํน์ฑ์ ๋ฐ์ํ ์ ์ฒ๋ฆฌ ํ์ดํ๋ผ์ธ ๋ฐ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ(ํ์ต๋ฅ ยท๋ฐฐ์น ํฌ๊ธฐยท์ค์ผ์ค๋ฌ ๋ฑ)๋ฅผ ์ ์ฉ
๊ฐ์ ์ฌํญ: ์ํ ์์ก ์ํ ๋ถ๋ฅ ์ ํ๋ ๋ฐ ์ผ๋ฐํ ์ฑ๋ฅ ํฅ์์ ํ์ธํ์์ผ๋ฉฐ, ์๋ฌผ๋ณ ๋ถ๊ด ๋ฐ์ ํน์ฑ์ ์ฐจ๋ณ์ ์ผ๋ก ๋ฐ์
์ถ๊ฐ ํ์ต: ์ํ ์ ์ฉ ๋ฉํฐ์คํํธ๋ผ ๋ฐ์ดํฐ์ (Blue, Green, Red, NIR, RedEdge)์ ํ์ฉํ ์ฌํ์ต ๊ณผ์ ์ ์ํํ์ฌ, ๋๋ก ยท์์ฑ ์์ ๊ธฐ๋ฐ ์๋ฌผ ๋ชจ๋ํฐ๋ง์ ์ ์ฉ ๊ฐ๋ฅ์ฑ ํ๋
๋๋ฉ์ธ ํ์ฅ: ๊ธฐ์กด ๋ง๋ ์ค์ฌ์ ๋ชจ๋ธ์ ์ํ ์๋ฌผ ์์ก ๋ถ์๊น์ง ํ์ฅํจ์ผ๋ก์จ, ๋ค์ค ์๋ฌผ ๋์ ์ ๋ฐ ๋์ (Precision Agriculture) ํ์ฉ์ฑ ๊ฐํ
Model Details
ConvNext_Multi๋ ๋ค์ค๋ถ๊ด(๋ฉํฐ์คํํธ๋ผ) ์์ ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ์ผ๋ก ํ์ฌ ์๋ฌผ ๋ฐ ์์์ ๋ถ๋ฅํ๋ ConvNeXt ๊ธฐ๋ฐ ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ชจ๋ธ์ ๋๋ค. ๋๋ก ๋ฐ ์์ฑ์์ ์ดฌ์ํ 5๋ฐด๋ (Blue, Green, Red, Near-Infrared, RedEdge) ์์์ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๋๋ก ์ค๊ณ๋์ด, ๊ณ ํด์๋ ๋์ ยทํ๊ฒฝ ๋ชจ๋ํฐ๋ง์ ์ ํฉํฉ๋๋ค.
- Developed by: AI Research Team, MuhanRnd
- License: MIT
- Base model: facebook/convnext-tiny-224
- Languages: Korean (๋ชจ๋ธ ์ฃผ์ ๋ฐ ๋ฌธ์ํ)
- Model type: ์ด๋ฏธ์ง ๋ถ๋ฅ (๋ฉํฐ๋ฐด๋ ์ ๋ ฅ)
- Created_date: 2025-06-05 13:32:18
- Updated_date: 2025-09-25 08:56:58
Uses
Direct Use
- ๋ค์ค๋ถ๊ด ์์ ๊ธฐ๋ฐ ์์ก ์ํ ๋ถ๋ฅ
- ๋๋ก ์์์ 5๋ฐด๋ ์ ๋ ฅ ๋ฉํฐ์คํํธ๋ผ ์ด๋ฏธ์ง ๋ถ๋ฅ ์์
Downstream Use
- ์ ์ฌํ ๋ค์ค๋ถ๊ด ๋ฐ์ดํฐ์ ์ ๋ํ ํ์ธํ๋
- ๋์ ์ธ ๊ธฐํ ํ๊ฒฝ ๋ชจ๋ํฐ๋ง ๋์ ๋ถ๋ฅ ๋ฌธ์ ์ ์ฉ ๊ฐ๋ฅ
Out-of-Scope Use
- RGB 3๋ฐด๋ ์์๋ง์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ (์ ๋ ฅ ๊ตฌ์กฐ์ ํ์ฉ ๋ถ๊ฐ)
- ๋ณด์ ๋์ง ์์ ๋ฉํฐ๋ฐด๋ ์ด๋ฏธ์ง(๋ค์ค๋ถ๊ด ๋ณด์ ๊ฐ ์ฒ๋ฆฌ ํ์)
- ๊ฐ์ฒด ๊ฒ์ถ, ๋ถํ ๋ฑ ๋ถ๋ฅ ์ด์ธ์ ํ์คํฌ
Bias, Risks, and Limitations
- ๋ณธ ๋ชจ๋ธ์ ํน์ ์ง์ญ ๋ฐ ์๋ฌผ ๋ฐ์ดํฐ๋ฅผ ์ค์ฌ์ผ๋ก ํ์ต๋์์ผ๋ฏ๋ก, ๋ฏธํ์ต ํ๊ฒฝ์์๋ ์ฑ๋ฅ ์ ํ๊ฐ ๋ฐ์ํ ์ ์์
- ๋ค์ค๋ถ๊ด ์์์ ํ์ง, ์ดฌ์ ์กฐ๊ฑด, ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๋ฏผ๊ฐํจ
- ๋ฐ์ดํฐ ํธํฅ์ผ๋ก ์ธํด ํน์ ์๋ฌผ์ด๋ ๋ฐฐ๊ฒฝ์ ๊ณผ์ ํฉ ๊ฐ๋ฅ์ฑ ์กด์ฌ
- ๋ชจ๋ธ ์์ธก์ ๋ณด์กฐ์ ํ๋จ ์๋ฃ๋ก ํ์ฉํด์ผ ํ๋ฉฐ, ์ต์ข ์์ฌ๊ฒฐ์ ์ ์ ๋ฌธ๊ฐ ํ๋จ๊ณผ ๋ณํ ํ์
How to Get Started
from transformers import AutoModelForImageClassification, AutoFeatureExtractor
import torch
# ๋ชจ๋ธ๊ณผ ํน์ง ์ถ์ถ๊ธฐ ๋ถ๋ฌ์ค๊ธฐ
model = AutoModelForImageClassification.from_pretrained("MhRnd/ConvNext_Multi")
extractor = AutoFeatureExtractor.from_pretrained("MhRnd/ConvNext_Multi")
# ๋ค์ค๋ฐด๋ ์ด๋ฏธ์ง ํ
์ (์: [batch_size, 5, H, W])
inputs = extractor(multi_band_images, return_tensors="pt")
# ๋ชจ๋ธ ์ถ๋ก
outputs = model(**inputs)
logits = outputs.logits
predicted_class = torch.argmax(logits, dim=1)
Training Details
Training Data:
- ๋๋ก ๋ฐ ์์ฑ ์ดฌ์ ๋ค์ค๋ถ๊ด(5๋ฐด๋) ์ด๋ฏธ์ง ๋ฐ์ดํฐ์
- ๋ผ๋ฒจ: ์ฃผ์ ์๋ฌผ ๋ฐ ์์ก ์ํ ํด๋์ค
Training Procedure:
- ํ์ธํ๋: facebook/convnext-tiny-224 ๊ธฐ๋ฐ
- ์ํญ์: 300
- ๋ฐฐ์น์ฌ์ด์ฆ: 16
- ์ตํฐ๋ง์ด์ : AdamW
- ํ์ต๋ฅ : 1e-06, Step ์ค์ผ์ค๋ฌ ์ฌ์ฉ
Evaluation
- Testing Data: ๋ณ๋ ๋ณด์ ํ ๊ฒ์ฆ์ฉ ๋ค์ค๋ถ๊ด ์ด๋ฏธ์ง์
- Metrics: ์ ํ๋(Accuracy), ์์ค(Loss)
- Performance:
- ๋ฒ ์คํธ ์ฑ๋ฅ (Epoch 82):
- ํ๋ จ ์์ค: 0.6502
- ํ๋ จ ์ ํ๋: 0.9537
- ๊ฒ์ฆ ์์ค: 0.7511
- ๊ฒ์ฆ ์ ํ๋: 0.9286
- ๋ง์ง๋ง ์ ๋ฐ์ดํธ: 2025-09-25 08:56:58
- ๋ฒ ์คํธ ์ฑ๋ฅ (Epoch 82):
Environmental Impact
- Hardware: NVIDIA RTX 3090 GPU (350W)
- Training Duration: 18.44 minutes
- Total FLOPs: 16650438.17 GFLOPs
Citation
@article{liu2022convnext,
title={ConvNeXt: A ConvNet for the 2020s},
author={Liu, Zhuang and Mao, Han and Wu, Chao and Feichtenhofer, Christoph and Darrell, Trevor and Xie, Saining},
journal={arXiv preprint arXiv:2201.03545},
year={2022}
}
Glossary
- ๋ค์ค๋ถ๊ด ์์(Multispectral Imagery): ์ฌ๋ฌ ํ์ฅ๋์ ๋น์ ๋ถ๋ฆฌํ์ฌ ์ดฌ์ํ ์์์ผ๋ก, ์๋ฌผ์ ์์ก ์ํ ๋ถ์ ๋ฑ์ ํ์ฉ๋จ
- ConvNeXt: ํ๋์ ์ธ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ถ ์ปจ๋ณผ๋ฃจ์ ์ ๊ฒฝ๋ง(CNN)
Model Card Authors
- AI Research Team, MuhanRnd
- [email protected]
Model tree for MhRnd/ConvNext_Multi
Base model
facebook/convnext-tiny-224