🏠 Ana Sayfa
Benchmarklar
📊 Tüm Benchmarklar 🦖 Dinozor v1 🦖 Dinozor v2 ✅ To-Do List Uygulamaları 🎨 Yaratıcı Serbest Sayfalar 🎯 FSACB - Nihai Gösteri 🌍 Çeviri Benchmarkı
Modeller
🏆 En İyi 10 Model 🆓 Ücretsiz Modeller 📋 Tüm Modeller ⚙️ Kilo Code
Kaynaklar
💬 Prompt Kütüphanesi 📖 YZ Sözlüğü 🔗 Faydalı Bağlantılar
Advanced

非结构化文本的高维特征工程

#NLP #特征工程 #机器学习 #数据挖掘

为特定的情感分析任务设计一套高级特征工程策略,处理语境依赖和稀疏性问题。

你是一位资深数据科学家。任务是基于社交媒体上的短文本数据进行多维度情感分类(如:愤怒、悲伤、喜悦、讽刺)。请设计一套高级特征工程流程,要求超越传统的TF-IDF和词袋模型。方案必须包含:1. 针对网络俚语和表情符号的语义编码策略;2. 利用预训练语言模型(如BERT)生成上下文相关的句向量;3. 构建句法依存特征以捕捉讽刺等复杂语气;4. 处理极端类别不平衡的数据采样技术。请详细说明每一步的实现原理及其对模型性能的潜在影响。