Hello-SimpleAI/HC3
Viewer • Updated • 48.6k • 4.97k • 213
Model pendeteksi teks hasil generasi AI berbasis BERT yang dilatih (fine-tuned) menggunakan dataset HC3 (Human–ChatGPT Comparison).
Model ini dirancang untuk keperluan riset dan eksperimen, khususnya dalam konteks:
0: Teks tulisan manusia1: Teks hasil generasi AIModel ini dilatih untuk menangkap pola linguistik dan gaya penulisan yang umum ditemukan pada teks hasil generasi AI, khususnya keluaran model bergaya ChatGPT.
01bert-base-uncased| Metrik | Nilai |
|---|---|
| Accuracy | 0.9917 |
| Precision | 0.9752 |
| Recall | 0.9993 |
| F1-score | 0.9871 |
Model menunjukkan recall yang hampir sempurna, yang berarti hampir seluruh teks hasil generasi AI berhasil terdeteksi. Precision tetap tinggi, meskipun terdapat sebagian kecil teks manusia yang terklasifikasi sebagai teks AI (false positive).
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
model_name = "xnajoan/xna-ai-text-detector"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
text = "Penelitian ini membahas implikasi penggunaan AI generatif dalam pendidikan tinggi."
inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=256)
with torch.no_grad():
outputs = model(**inputs)
prediction = torch.argmax(outputs.logits, dim=1).item()
label = "AI-generated" if prediction == 1 else "Human-written"
print(label)
Base model
google-bert/bert-base-uncased