用户自主生产的内容确实良莠混杂,反垃圾是非常重要的一环。文字、图片、视频、音频等都应有一定程度的监控。由于垃圾信息变化多端,反垃圾相对的技术要求也更高。如文字需要考虑符号、汉语变体、拼音以及各类样本,图片则难度更高,需要对图片进行精确识别,对产品来说,反垃圾系统的响应时间、过滤的准确度都非常关键,因此仅靠人力去过滤效率是非常低的,机器的过滤才是关键,但这对技术要求非常高。
另外还想多说一句,创业型公司组建团队做反垃圾项目其实是非常占用人力的,反垃圾的难度决定了它对技术实力的要求,大公司更有实力和资金进行技术研发。我接触到的大多数都是由外包团队做的。而目前国外别做的比较好的如pic check,国内如网易的易盾等,技术实力都比较强。