🏠 Home
Benchmark Hub
📊 All Benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List Applications 🎨 Creative Free Pages 🎯 FSACB - Ultimate Showcase 🌍 Translation Benchmark
Models
🏆 Top 10 Models 🆓 Free Models 📋 All Models ⚙️ Kilo Code
Resources
💬 Prompts Library 📖 AI Glossary 🔗 Useful Links
Advanced

非结构化文本的高维特征工程

#NLP #特征工程 #机器学习 #数据挖掘

为特定的情感分析任务设计一套高级特征工程策略,处理语境依赖和稀疏性问题。

你是一位资深数据科学家。任务是基于社交媒体上的短文本数据进行多维度情感分类(如:愤怒、悲伤、喜悦、讽刺)。请设计一套高级特征工程流程,要求超越传统的TF-IDF和词袋模型。方案必须包含:1. 针对网络俚语和表情符号的语义编码策略;2. 利用预训练语言模型(如BERT)生成上下文相关的句向量;3. 构建句法依存特征以捕捉讽刺等复杂语气;4. 处理极端类别不平衡的数据采样技术。请详细说明每一步的实现原理及其对模型性能的潜在影响。