我想你给我为了解决这个问题,一些建议。 在大学里我已经解决意见挖掘任务,但与Twitter的做法是相当不同的。 例如,我用了一个集成学习方法的用户约在西班牙某酒店的意见进行分类。 当然,我给出正面和负面舆论的训练集,然后我与测试组的测试。 但现在,Twitter的,我发现这种分类的非常困难。
我需要有一个训练集? 如果这个问题的答案是肯定的,你不觉得Twitter是这样的时间,所以如果我有一组,我对未来主题的表现会很差?
我想在得到一本字典(主要是形容词),并越过我的鸣叫与它得到一个术语文档矩阵,但我没有分配到任何的Twitter类。 此外,积极形容词和消极形容词可以根据主题和时间而变化。 那么,如何面对呢?
如何处理语言的问题? 举例来说,我想学习用英文写的和那些在西班牙的鸣叫,但分开。
哪些编程语言你建议做这样的事情? 我一直在试图与R封装像TM,微博。