<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SocialBeta &#187; 协同推荐</title>
	<atom:link href="http://www.socialbeta.cn/articles/tag/%e5%8d%8f%e5%90%8c%e6%8e%a8%e8%8d%90/feed" rel="self" type="application/rss+xml" />
	<link>http://www.socialbeta.cn</link>
	<description>社会化媒体&#124;社会化设计&#124;社区型网站运营&#124;社会化媒体相关资源分享</description>
	<lastBuildDate>Wed, 08 Sep 2010 01:15:06 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>忘记bing吧，hunch才是真正的“决策引擎”</title>
		<link>http://www.socialbeta.cn/articles/hunch-and-bing.html</link>
		<comments>http://www.socialbeta.cn/articles/hunch-and-bing.html#comments</comments>
		<pubDate>Tue, 16 Jun 2009 15:28:58 +0000</pubDate>
		<dc:creator>puting</dc:creator>
				<category><![CDATA[社会化媒体]]></category>
		<category><![CDATA[bing]]></category>
		<category><![CDATA[flickr]]></category>
		<category><![CDATA[hunch]]></category>
		<category><![CDATA[hunch体验]]></category>
		<category><![CDATA[hunch评测]]></category>
		<category><![CDATA[startup]]></category>
		<category><![CDATA[决策引擎]]></category>
		<category><![CDATA[协同推荐]]></category>
		<category><![CDATA[协同过滤]]></category>
		<category><![CDATA[社会化决策]]></category>
		<category><![CDATA[社会化推荐]]></category>

		<guid isPermaLink="false">http://www.socialbeta.cn/?p=34562</guid>
		<description><![CDATA[最近上线的bing，微软称其为&#8221;决策引擎&#8221;，我看了一眼，没有多大的兴趣，也许一个搜索框这中老面孔见太多了，而昨天新上线的hunch，我今天体验了一把，这个主要是因为很早之前就在读写网上看过介绍，hunch是flickr的联合创始人的一个新项目，hunch是一个&#8221;社会化的决策引擎&#8221;，通过社会化的力量帮助人们更好的作出一些决策。下面我就来体验一下： 设计方面 给我的第一印象是很朴素淡雅，咋一看还觉得是素版flickr，网站导航和flickr是一个模子出来的，还有其他的一些页面（如TOUR），几乎是照着flickr来的，创始人是同一个，多少都有一点flickr的痕迹。 流程体验 对于这种社会化的推荐系统，在最初没有多少用户信息的情况下，只能通过事先告诉网站一些信息，在一些音乐推荐网站经常用到这种，会让用户回答一些问题，这样网站就多少收集到用户的一些信息。Hunch也是这样； 1. 用户信息收集 第一步，hunch会问你一些问题，大概是20个的样子，而每个问题都可以跳过，回答问题也只是选择其中一下，操作起来非常简单，而其中的问题也设计的非常有趣，比如你喜欢碰碰车吗？你相信外星人绑架地球人的传闻吗？而没回答一个问题，他都会给你一个统计结果，显示有多少人和你选择了相同的答案。 当你完成这些回答之后，hunch会让你注册，因为只有注册用户才能越用越灵光，给你推荐的东西才越来越精准，就像豆瓣一样，用的多了，他也就知道你喜欢什么样的书了。 2. 给你决策参考 当然，你也可以直接选一个你喜欢的话题，我选了一个&#8221;do i need a smart phone？（我需要一部智能手机吗？）&#8221;，这个时候，hunch不会立刻给你一个答案，hunch还是要你回答一些问题，而这些问题都是针对这个话题来的，就像问你的朋友，我是不是要买一部智能手机？你的朋友不会立马告诉你买还是不买，他一定会先问你一些问题，比如，你是不是经常会用查看你的电子邮件？你是不是要用来来上网浏览网页？而hunch也是一样的，hunch也有这些问题等这你回答，一般有10个左右的问题会询问你，最后会给你答案，当然，中间可以跳过其中的一些问题，或者也可以直接让hunch给你一个答案。 这些问题回答好之后，hunch会给你一个基于你回答的问题来给你一个答案，而对于这样它给你的结果，你可以选择同意还是不同意，这其实也是在收集用户的信息，而针对这个答案，用户可以在下面写下赞成或者反对的理由，而对于理由，其他用户有可以评价，他的理由是否是有帮助，hunch无处不在收集用户的信息。 3. 对决策参考的评价和修正 Hunch不不仅给你一个答案，还会给你为什么要给你这样的答案，给你充足的数据说明，他会将你要先回答的题目全部列出来，当然，因为给的结果不是唯一的，hunch会按照用户对于结果的认可度给你排一个顺序，告诉这个答案在全部用户中是受欢迎程度排在第几，如果你是注册用户，hunch还会根据和你类似的人（之前回答问题就是收集有多少人和你相似）对这个答案是怎么看待的。 hunch的这些结果不是一成不变的，用户可以通过修正这些需要回答的问题，使得问题的针对性更强，为了防止乱修改，hunch规定要有创建一个话题和完整的参加三个话题，才能使用使用这个功能。 关于盈利模式 因为hunch上面得门类很齐全，而人们在衣食住行方面做决定都和消费多少沾一点边，目前我看到有少数的答案会指向Amazon购物，这就像豆瓣对于书本的比价，给这些商城带去多少用户，从这些商家这里分成。 而创始人在其博客上也说到这一点，hunch目前不考虑太多的盈利方式，现在的唯一要做的事情是把产品做好，绝对不会推销给用户不喜欢的东西。 总结 1.社会化网站要设计简单，每步流程操作都要用一种交谈的语气。hunch的一个关键环节是收集用户信息，而这就要hunch必须要像一个人那样问用户一些问题，如果这些这设计的很生硬（流程，文案），用户就会很反感，不愿回答问题，hunch这方面做的比较好。 2.任何时候都不要强制用户做什么。Hunch在为用户提供决策参考前都会先问用户一些问题，当然，这些问题并不是要强制完成的，可以跳过，或者一个都不回答，直接让hunch给出答案，虽然这样做，也许用户得到的参考会不够精确，但是在收集信息和用户感受面前，hunch选择了后者，hunch知道罗马不是一日建成的。 3.把用户参与的成本最低化。hunch这种网站最主要的尽可能多的收集到用户的信息，用户在hunch上的一举一动都hunch来说都是很宝贵的，即使是满意，不满意这样一个鼠标都能做的事情，hunch把这些提示做的很明显，用户参与起来也很方便。 4.巧用激励机制鼓励用户参与贡献。Hunch有一套很完整的积分等级系统，达到一定等级就有对应的勋章。 5. 巧用社会化媒体。Hunch本身是一个社会化网站，而hunch在twitter上和facebook上都有自己的根据地。 6. 最后一点是twitter的follow可能是以后每个网站的必备的一个基本功能，hunch上貌似只有follow的功能，没有成为好友这个功能。 —————— 您可能对下面的文章感兴趣： 推荐系统：电子商务网站的“金牌销售员” 【一心一译】协同过滤（Collaborative Filtering）：社会化网络的生命线]]></description>
			<content:encoded><![CDATA[<p><a href="http://picasaweb.google.com/lh/photo/AVqXqM5-KOzpTqxAWXv4fQ?feat=embedwebsite"><span style="font-size: small;"><img class="alignleft" src="http://lh3.ggpht.com/_swORy2H8Big/Sje5O1A0KoI/AAAAAAAAAVs/h5trU7_lGM0/s800/hunc.jpg" alt="" width="129" height="59" /></span></a><span style="font-size: small;">最近上线的bing，微软称其为&#8221;决策引擎&#8221;，我看了一眼，没有多大的兴趣，也许一个搜索框这中老面孔见太多了，而昨天新上线的hunch，我今天体验了一把，这个主要是因为很早之前就在</span><a href="http://www.readwriteweb.com/archives/flickr_co-founder_unveils_her_new_startup_hunch.php"><span style="font-size: small;">读写网上看过介绍</span></a><span style="font-size: small;">，hunch是flickr的联合创始人的一个新项目，hunch是一个&#8221;社会化的决策引擎&#8221;，通过社会化的力量帮助人们更好的作出一些决策。下面我就来体验一下：</span></p>
<p><span style="font-size: small;"><strong>设计方面</strong><br />
给我的第一印象是很朴素淡雅，咋一看还觉得是素版flickr，网站导航和flickr是一个模子出来的，还有其他的一些页面（如TOUR），几乎是照着flickr来的，创始人是同一个，多少都有一点flickr的痕迹。</span></p>
<p><a href="http://picasaweb.google.com/lh/photo/km4Tv0FB-ABWZqEDjaDjWA?feat=embedwebsite"><span style="font-size: small;"><img src="http://lh5.ggpht.com/_swORy2H8Big/Sje10Xfc08I/AAAAAAAAAVM/7ChRQ3KGCsI/s400/hunch.jpg" alt="" /></span></a></p>
<p><span style="font-size: small;"><strong>流程体验</strong><br />
对于这种社会化的推荐系统，在最初没有多少用户信息的情况下，只能通过事先告诉网站一些信息，在一些音乐推荐网站经常用到这种，会让用户回答一些问题，这样网站就多少收集到用户的一些信息。Hunch也是这样；</span></p>
<p><span style="font-size: small;"><strong>1. 用户信息收集</strong><br />
第一步，hunch会问你一些问题，大概是20个的样子，而每个问题都可以跳过，回答问题也只是选择其中一下，操作起来非常简单，而其中的问题也设计的非常有趣，比如你喜欢碰碰车吗？你相信外星人绑架地球人的传闻吗？而没回答一个问题，他都会给你一个统计结果，显示有多少人和你选择了相同的答案。</span></p>
<p><span style="font-size: small;">当你完成这些回答之后，hunch会让你注册，因为只有注册用户才能越用越灵光，给你推荐的东西才越来越精准，就像豆瓣一样，用的多了，他也就知道你喜欢什么样的书了。</span></p>
<p><span style="font-size: small;"><strong>2. 给你决策参考</strong><br />
当然，你也可以直接选一个你喜欢的话题，我选了一个&#8221;do i need a smart phone？（我需要一部智能手机吗？）&#8221;，这个时候，hunch不会立刻给你一个答案，hunch还是要你回答一些问题，而这些问题都是针对这个话题来的，就像问你的朋友，我是不是要买一部智能手机？你的朋友不会立马告诉你买还是不买，他一定会先问你一些问题，比如，你是不是经常会用查看你的电子邮件？你是不是要用来来上网浏览网页？而hunch也是一样的，hunch也有这些问题等这你回答，一般有10个左右的问题会询问你，最后会给你答案，当然，中间可以跳过其中的一些问题，或者也可以直接让hunch给你一个答案。<br />
</span><a href="http://picasaweb.google.com/lh/photo/tp9xT3XmdEMJ26ZgRR23Ng?feat=embedwebsite"><span style="font-size: small;"><img src="http://lh4.ggpht.com/_swORy2H8Big/Sje1sN2E57I/AAAAAAAAAUo/9OmQLmVVsx0/s400/hun2.jpg" alt="" /></span></a></p>
<p><span style="font-size: small;">这些问题回答好之后，hunch会给你一个基于你回答的问题来给你一个答案，而对于这样它给你的结果，你可以选择同意还是不同意，这其实也是在收集用户的信息，而针对这个答案，用户可以在下面写下赞成或者反对的理由，而对于理由，其他用户有可以评价，他的理由是否是有帮助，hunch无处不在收集用户的信息。</span></p>
<p><span style="font-size: small;">3. <strong>对决策参考的评价和修正</strong><br />
Hunch不不仅给你一个答案，还会给你为什么要给你这样的答案，给你充足的数据说明，他会将你要先回答的题目全部列出来，当然，因为给的结果不是唯一的，hunch会按照用户对于结果的认可度给你排一个顺序，告诉这个答案在全部用户中是受欢迎程度排在第几，如果你是注册用户，hunch还会根据和你类似的人（之前回答问题就是收集有多少人和你相似）对这个答案是怎么看待的。<br />
</span><a href="http://picasaweb.google.com/lh/photo/MA0nhMsf7ISfeqBUNJH26w?feat=embedwebsite"><span style="font-size: small;"><img src="http://lh5.ggpht.com/_swORy2H8Big/Sje1zD41mqI/AAAAAAAAAVE/Binobz1XnYI/s400/hun3.jpg" alt="" /></span></a><br />
<span style="font-size: small;">hunch的这些结果不是一成不变的，用户可以通过修正这些需要回答的问题，使得问题的针对性更强，为了防止乱修改，hunch规定要有创建一个话题和完整的参加三个话题，才能使用使用这个功能。</span></p>
<p><span style="font-size: small;"><strong>关于盈利模式</strong><br />
因为hunch上面得门类很齐全，而人们在衣食住行方面做决定都和消费多少沾一点边，目前我看到有少数的答案会指向Amazon购物，这就像豆瓣对于书本的比价，给这些商城带去多少用户，从这些商家这里分成。</span></p>
<p><span style="font-size: small;">而创始人在其博客上也说到这一点，hunch目前不考虑太多的盈利方式，现在的唯一要做的事情是把产品做好，绝对不会推销给用户不喜欢的东西。</span></p>
<p><span style="font-size: small;"><strong>总结</strong><br />
1</span><a href="http://socialdesign.cn"><span style="font-size: small;">.社会化网站要设计简单</span></a><span style="font-size: small;">，每步流程操作都要用一种交谈的语气。hunch的一个关键环节是收集用户信息，而这就要hunch必须要像一个人那样问用户一些问题，如果这些这设计的很生硬（流程，文案），用户就会很反感，不愿回答问题，hunch这方面做的比较好。</span></p>
<p><span style="font-size: small;">2.任何时候都不要强制用户做什么。Hunch在为用户提供决策参考前都会先问用户一些问题，当然，这些问题并不是要强制完成的，可以跳过，或者一个都不回答，直接让hunch给出答案，虽然这样做，也许用户得到的参考会不够精确，但是在收集信息和用户感受面前，hunch选择了后者，hunch知道罗马不是一日建成的。</span></p>
<p><span style="font-size: small;">3.把用户参与的成本最低化。hunch这种网站最主要的尽可能多的收集到用户的信息，用户在hunch上的一举一动都hunch来说都是很宝贵的，即使是满意，不满意这样一个鼠标都能做的事情，hunch把这些提示做的很明显，用户参与起来也很方便。</span></p>
<p><span style="font-size: small;">4.巧用激励机制鼓励用户参与贡献。Hunch有一套很完整的积分等级系统，达到一定等级就有对应的勋章。</span></p>
<p><span style="font-size: small;">5. 巧用社会化媒体。Hunch本身是一个社会化网站，而hunch在twitter上和facebook上都有自己的根据地。</span></p>
<p><span style="font-size: small;">6. 最后一点是twitter的follow可能是以后每个网站的必备的一个基本功能，hunch上貌似只有follow的功能，没有成为好友这个功能。</span></p>
<p><span style="font-size: small;">——————<br />
您可能对下面的文章感兴趣：<br />
</span><a href="http://www.socialbeta.cn/articles/recommendation.html"><span style="font-size: small;">推荐系统：电子商务网站的“金牌销售员”</span></a><br />
<a href="http://www.socialbeta.cn/articles/collaborative-filtering.html"><span style="font-size: small;">【一心一译】协同过滤（Collaborative Filtering）：社会化网络的生命线</span></a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.socialbeta.cn/articles/hunch-and-bing.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>【一心一译】协同过滤（Collaborative Filtering）：社会化网络的生命线</title>
		<link>http://www.socialbeta.cn/articles/collaborative-filtering.html</link>
		<comments>http://www.socialbeta.cn/articles/collaborative-filtering.html#comments</comments>
		<pubDate>Tue, 26 May 2009 02:02:19 +0000</pubDate>
		<dc:creator>puting</dc:creator>
				<category><![CDATA[社会化媒体]]></category>
		<category><![CDATA[Collaborative Filtering]]></category>
		<category><![CDATA[一心一译]]></category>
		<category><![CDATA[协同推荐]]></category>
		<category><![CDATA[协同过滤]]></category>
		<category><![CDATA[社会化推荐]]></category>
		<category><![CDATA[社会化网络]]></category>

		<guid isPermaLink="false">http://www.socialbeta.cn/?p=30588</guid>
		<description><![CDATA[原文作者 &#124; Muhammad Saleem   译者 &#124; puting 协同过滤（维基百科的定义）是通过将过滤操作在一大群人中扩散，用于过滤大量信息的一种机制。与主流媒体都有一个或少数几个编辑设定一些指导原则不同的是，协同过滤的社会化网络可以有无穷多的编辑，并随着参与者人数的增多而变地更好。 协同过滤基于以下的两个基本原则之上。 1. 群体智慧和多数原则表明，随着社区的成长，不仅一个大的（不同的、独立的等）社区能做出比少数编辑更好的决策，而社区的进一步壮大，其作出的决定也会也来越好。因此，比起现有的哪些武断专横的媒体，如果我们能建立一些协作过滤的报纸、电视台、广播电台等，这会更好（对这个社会来说）。事实上，正如我们将看到的一些服务，如Digg、 YouTube和Last.fm，正试图来做这样的事情——协同过滤（ CF ）媒体。  2.协同过滤的第二个原则表明，在任何一个大型的社区中，只要拥有单个参与者以及他们之间是如何合作、如何彼此关联的足够数据，基于他们过去的爱好，我们就可以推测出，这些用户今后将会喜欢什么，也就是创造了一个协作过滤推荐引擎。当然，这依赖于一个事实，即人们的利益、偏好、以及意识形态不会随着时间的改变而发生巨大的变化。  协同过滤系统的这两个方面会产生两个非常不同的重要效果。 通过社区的判定，协同过滤的第一个效果是让你发现一些新的、有趣的、富有娱乐性的、以及有新闻价值的信息，Digg头版就是一个这样的很好例子。并非所有的内容都将直接和你的兴趣相关联，事实上有些内容则完全和您不相干。然而，随着社区的发展，会变地越来越多样化和富有个性，基于大众兴趣而推荐到头版的新闻能满足社区成员中的普遍兴趣。如果对这些基于普遍兴趣的新闻不满意呢？这就是第二个方面的效果。 协同过滤系统的第二个效果是收集的信息是基于哪种内容、你喜欢还是不喜欢的评注，并根据您提交并参加投票的习惯，这些正是用户数据概况。这可以帮助网站向用户推荐一些由你基本认同的用户（或来源）提交的内容，以及找到一些您通常经常参与投票和评论的有趣主题。这意味着，通过收集你是如何与该网站以及与其他用户交往的足够信息，协同过滤（ CF ）系统可以为你推荐内容。该系统发现内容并将其提供给您，而不需要你去搜寻这些。此外，随着您越来越多地使用推荐系统以及“顶和踩”的机制，这个协同过滤系统给你推荐的内容也会变地越来越精确。 一个很重要的事实，许多社会化网站并没有意识到这点，即协同过滤（ CF ）系统并不能根据您的喜好自动匹配内容，它有天然的缺陷。原因很简单：除非你能获得完全的多样性和独立的看法，对于某一特定的平台，一种观点总是支配着另外一种。在一个社会化网站上面，如果占主导地位的观点是左倾的，那么右翼观点几乎每次都会被淹没，因为他们没有能力将最合适的内容传递给最关注的人群。   一个很好的例子，德州议员保罗的支持者们很容易能够操纵社会新闻网站。现在，如果你能符合右翼分子的右翼观点，也能符合持左翼观点的左翼分子，并让对这两种观点有兴趣的人进行健康的超越党派政治的辩论，那么你就接近了的理想的系统。一个具有以偏好为基础的推荐功能的过滤系统，本质上来说，是社会化网络的未来。 谁在运用这样的系统？ 协同过滤（ CF ）系统毫无疑问是社会化网络的生命线。尽管不同的平台使用的程度不同，该系统依然是核心，如果没有它，就像没有积极的交通治安，社会化网络显得像在拉合尔市中心的交通高峰那样。 社会化新闻网站 社会化新闻网站如digg和propeller，仅仅在首页范围内使用了协同过滤。一旦内容被推荐至首页，协同过滤系统的工作就算完成了。协同过滤系统能让你摆脱垃圾邮件和一些无创造性的思想，但它是不是最好的，因为它依赖于平均水平，而不是直接依赖于每一个参与者。虽然这些网站尝试和发展自己的推荐引擎，而Reddit和StumbleUpon公司通过推荐引擎已经超过了他们。这两个网站也有类似的概念，一个社区头版（基于社区中普遍成员的普遍兴趣），他们根据您的历史好恶为你提供最优质和最相关的内容，以提高你的体验和激励你更多的参与。此外，正常化的Reddit头版表明一个头版符合所有办法符合和冲淡了单个用户的体验，而标准化确保每个用户能控制内容是如何分发给他们的。 最后，即使有一些网站很少或根本没有过滤（Slashdot, Fark,等） ，那些使用协同过滤系统的推荐引擎网站将继续减弱从即将提交队列积极筛选的重要性，用于提高在个人水平层次上的用户体验。 视频流和视频分享网站 在线视频网站托管和视频分享网站之间没有多大差别。像视频分享网站YouTube有多种过滤机制，往往履行相同的职能，而不依赖于可见的投票本身，例如，是由下面几点决定的： 1.目前观看视频的人数 2.对一个视频的评论数 3.一个视频的用户评价数和收藏数 以印象为基础的系统（如Spotplex）有一个问题是，你看到或评论的东西并不意味着它就是好的。事实上，有几十个YouTube视频，我按一下，不喜欢他们，然后关闭该窗口（我看到其他人用蹩脚的英语写的的那些负面评论，非常怀疑这些对于别人会有帮助） 。其他一些网站，如break和Funny or Die使用类似StumbleUpon一样的支持和不支持的投票机制，以确定是否被推荐至头版。同样，虽然有查看相似和相关相关视频，查看来自一些相关用户的视频这样的选项，但还是没有推荐系统使用您的评价和favoriting习惯（和标签您喜欢）。 博客和微博客 在大多数情况下，博客运用一种综合了最多人浏览、最多人链接、最多评论以及最高评价等各种因素，来做为向你展示你可能喜欢的内容机制。这虽是一个比通过让人们反复试验和发生错误更好的方法，但这并不能确保每个访客都能对他们看到的内容感到满意。例如，在你的博客上，有两篇完全不同主题的博文可能是最受欢迎的，但我可能只会喜欢其中的一篇。与此同时，还必须弄清楚，什么时候开始监控每个独立的用户才是经济且及时有效的？ StumbleUpon是解决了这个问题的&#8217;大家伙&#8217; ，让你StumbleThru一个可能有你最喜欢的内容的网站，然而，这一特色，并非适用于所有的网站。 遗憾的是，绝大数微博客网站，还没有任何过滤系统。在twitter及其同类网站中，信噪比的争论异常的激烈。 不过，FriendFeed 发布了一个最基本的推荐功能，简单地展示了一些“最受欢迎”和“最多评论”的链接。 图片存储和分享网站 当我考虑协同过滤系统的时候，图片分享网站如Flickr和photobucket根本不在我的视线范围内，其中一个原因是我知道大部分使用这些网站的用户主要是为了存储和找一些cc版权的图片嵌入到他们的网站中，不过，我很惊喜地发现flickr已能帮助人们探索和发现一些好的图片。   这项对于大多数人可能是熟悉的功能是有趣的，也相当的强劲。它会考虑到如一张图片的推介流量来自哪里，谁在什么时候评论了它，谁收藏了它，又有多少人喜欢它以及其他更微妙的东西。除此之外，该网站还拥有其他一些不寻常的功能，如基于世界地图上地理标记、流行的标签、相关主题、以品质为基础的群体、相机型号和最近上传的探索。 音乐流和音乐发现网站 将推荐和发现系统结合协同过滤实施最好的例子，我所看到的都是关于音乐流和音乐发现网站。例如，在Last.fm上的实施，我认为接近完美。首先，不管你是使用他们的在线流媒体widget还是他们的客户端，Last.fm会跟踪每首你听的歌曲并收集这些数据。他们每周也会跟踪那些在你的试听列表出现和消失的艺术家们的数据，并使用这些数据为你做个性化的推荐，自动创建一个播放Last.fm向你推荐歌曲的电台。 [...]]]></description>
			<content:encoded><![CDATA[<p><span style="font-family: 'Lucida Sans';"><span style="font-size: small;"><span style="font-size: small;">原文作者 |</span> </span><a href="http://www.readwriteweb.com/archives/collaborative_filtering_social_web.php" target="_blank"><span style="color: windowtext; text-decoration: none;"><span style="font-size: small;">Muhammad Saleem</span></span></a><span style="font-size: small;">   译者 | <a href="http://www.socialbeta.cn/"><span style="font-size: small;">puting</span></a></span></span></p>
<p><span style="font-size: small;"><img class="alignleft" src="http://www.readwriteweb.com/images/socialmedia-logos.jpg" alt="" />协同过滤（</span><a id="tdyl" title="维基百科的定义" name="tdyl" href="http://en.wikipedia.org/wiki/Collaborative_filtering" target="_blank"><span style="font-size: small;">维基百科的定义</span></a><span style="font-size: small;">）是通过将过滤操作在一大群人中扩散，用于过滤大量信息的一种机制。与主流媒体都有一个或少数几个编辑设定一些指导原则不同的是，协同过滤的社会化网络可以有无穷多的编辑，并随着参与者人数的增多而变地更好。</span></p>
<p><strong><span style="font-size: small;">协同过滤基于以下的两个基本原则之上。</span></strong></p>
<p><span style="font-size: small;"><strong>1.</strong> <span style="font-family: 宋体;"><a id="fpk9" title="群体智慧" name="fpk9" href="http://en.wikipedia.org/wiki/Wisdom_of_crowds" target="_blank"><span style="font-size:small; color: #006699;">群体智慧</span></a><span style="font-size: small;">和</span><a id="v-:c" title="多数原则" name="v-:c" href="http://en.wikipedia.org/wiki/Law_of_large_numbers" target="_blank"><span style="font-size: small; color: #006699;">多数原则</span></a></span>表明，随着社区的成长，不仅一个大的（不同的、独立的等）社区能做出比少数编辑更好的决策，而社区的进一步壮大，其作出的决定也会也来越好。因此，比起现有的哪些武断专横的媒体，如果我们能建立一些协作过滤的报纸、电视台、广播电台等，这会更好（对这个社会来说）。事实上，正如我们将看到的一些服务，如<span style="font-family: 'Lucida Sans';"><a id="f-31" title="Digg" name="f-31" href="http://digg.com/" target="_blank"><span style="font-size: small; color: #006699;">Digg</span></a></span><span style="font-size: small;"><span style="font-family: 宋体;">、</span> <span style="font-family: 'Lucida Sans';">YouTube</span><span style="font-family: 宋体;">和</span><span style="font-family: 'Lucida Sans';"><a id="bau4" title="Last.fm" name="bau4" href="http://last.fm/" target="_blank"><span style="color: #006699;">Last.fm</span></a></span></span>，正试图来做这样的事情——协同过滤（ CF ）媒体。</span></p>
<p><span style="font-size: small;"><strong> 2.</strong>协同过滤的第二个原则表明，在任何一个大型的社区中，只要拥有单个参与者以及他们之间是如何合作、如何彼此关联的足够数据，基于他们过去的爱好，我们就可以推测出，这些用户今后将会喜欢什么，也就是创造了一个协作过滤推荐引擎。当然，这依赖于一个事实，即人们的利益、偏好、以及意识形态不会随着时间的改变而发生巨大的变化。</span></p>
<p><strong><span style="font-size: small;"> 协同过滤系统的这两个方面会产生两个非常不同的重要效果。</span></strong></p>
<p><span style="font-size: small;">通过社区的判定，协同过滤的第一个效果是让你发现一些新的、有趣的、富有娱乐性的、以及有新闻价值的信息，Digg头版就是一个这样的很好例子。并非所有的内容都将直接和你的兴趣相关联，事实上有些内容则完全和您不相干。然而，随着社区的发展，会变地越来越多样化和富有个性，基于大众兴趣而推荐到头版的新闻能满足社区成员中的普遍兴趣。如果对这些基于普遍兴趣的新闻不满意呢？这就是第二个方面的效果。</span></p>
<p><span style="font-size: small;">协同过滤系统的第二个效果是收集的信息是基于哪种内容、你喜欢还是不喜欢的评注，并根据您提交并参加投票的习惯，这些正是用户数据概况。这可以帮助网站向用户推荐一些由你基本认同的用户（或来源）提交的内容，以及找到一些您通常经常参与投票和评论的有趣主题。这意味着，通过收集你是如何与该网站以及与其他用户交往的足够信息，协同过滤（ CF ）系统可以为你推荐内容。该系统发现内容并将其提供给您，而不需要你去搜寻这些。此外，随着您越来越多地使用推荐系统以及“顶和踩”的机制，这个协同过滤系统给你推荐的内容也会变地越来越精确。</span></p>
<p><span style="font-size: small;">一个很重要的事实，许多社会化网站并没有意识到这点，即协同过滤（ CF ）系统并不能根据您的喜好自动匹配内容，它有天然的缺陷。原因很简单：除非你能获得完全的多样性和独立的看法，对于某一特定的平台，一种观点总是支配着另外一种。在一个社会化网站上面，如果占主导地位的观点是左倾的，那么右翼观点几乎每次都会被淹没，因为他们没有能力将最合适的内容传递给最关注的人群。<br />
 <br />
一个很好的例子，德州议员保罗的支持者们很容易能够操纵社会新闻网站。现在，如果你能符合右翼分子的右翼观点，也能符合持左翼观点的左翼分子，并让对这两种观点有兴趣的人进行健康的超越党派政治的辩论，那么你就接近了的理想的系统。<strong>一个具有以偏好为基础的推荐功能的过滤系统，本质上来说，是社会化网络的未来。</strong></span></p>
<p><strong><span style="font-size: small;">谁在运用这样的系统？</span></strong></p>
<p><span style="font-size: small;">协同过滤（ CF ）系统毫无疑问是社会化网络的生命线。尽管不同的平台使用的程度不同，该系统依然是核心，如果没有它，就像没有积极的交通治安，社会化网络显得像在拉合尔市中心的交通高峰那样。</span></p>
<p><span style="font-size: small;"><strong>社会化新闻网站</strong><br />
社会化新闻网站如digg和<span style="font-family: 'Lucida Sans';"><a id="pxce" title="propeller" name="pxce" href="http://propeller.com/" target="_blank"><span style="font-size: small; color: #006699;">propeller</span></a></span>，仅仅在首页范围内使用了协同过滤。一旦内容被推荐至首页，协同过滤系统的工作就算完成了。协同过滤系统能让你摆脱垃圾邮件和一些无创造性的思想，但它是不是最好的，因为它依赖于平均水平，而不是直接依赖于每一个参与者。虽然这些网站尝试和发展自己的推荐引擎，<span style="font-size: small;">而<span style="font-family: 'Lucida Sans';"><span style="font-family: 'Lucida Sans';"><a id="hu23" title="Reddit" name="hu23" href="http://reddit.com/" target="_blank"><span style="color: #006699;">Reddit</span></a></span></span><span style="font-family: 宋体;">和</span><span style="font-family: 'Lucida Sans';"><a id="eol1" title="StumbleUpon" name="eol1" href="http://stumbleupon.com/" target="_blank"><span style="color: #006699;">StumbleUpon</span></a></span></span>公司通过推荐引擎已经超过了他们。这两个网站也有类似的概念，一个社区头版（基于社区中普遍成员的普遍兴趣），他们根据您的历史好恶为你提供最优质和最相关的内容，以提高你的体验和激励你更多的参与。此外，正常化的Reddit头版表明一个头版符合所有办法符合和冲淡了单个用户的体验，而标准化确保每个用户能控制内容是如何分发给他们的。</span></p>
<p><span style="font-size: small;">最后，即使有一些网站很少或根本没有过滤（<span style="font-family: 'Lucida Sans';"><a href="http://slashdot.org/" target="_blank"><span style="font-size: small; color: #006699;">Slashdot</span></a><span style="font-size: small;">, </span><a href="http://fark.com/" target="_blank"><span style="font-size: small; color: #006699;">Fark</span></a></span>,等） ，那些使用协同过滤系统的推荐引擎网站将继续减弱从即将提交队列积极筛选的重要性，用于提高在个人水平层次上的用户体验。</span></p>
<p><span style="font-size: small;"><strong>视频流和视频分享网站</strong><br />
在线视频网站托管和视频分享网站之间没有多大差别。像视频分享网站YouTube有多种过滤机制，往往履行相同的职能，而不依赖于可见的投票本身，例如，是由下面几点决定的：<br />
1.目前观看视频的人数<br />
2.对一个视频的评论数<br />
3.一个视频的用户评价数和收藏数</span></p>
<p><span style="font-size: small;">以印象为基础的系统（如</span><a id="k63w" title="Spotplex" name="k63w" href="http://www.spotplex.com/" target="_blank"><span style="font-size: small;">Spotplex</span></a><span style="font-size: small;">）有一个问题是，你看到或评论的东西并不意味着它就是好的。事实上，有几十个YouTube视频，我按一下，不喜欢他们，然后关闭该窗口（我看到其他人用蹩脚的英语写的的那些负面评论，非常怀疑这些对于别人会有帮助） 。其他一些网站，<span style="font-size: small;">如<span style="font-family: 'Lucida Sans';"><a id="zo.f" title="break" name="zo.f" href="http://break.com/" target="_blank"><span style="color: #006699;">break</span></a></span><span style="font-family: 宋体;">和</span><span style="font-family: 'Lucida Sans';"><a id="rysu" title="Funny or Die" name="rysu" href="http://funnyordie.com/" target="_blank"><span style="color: #006699;">Funny or Die</span></a></span></span>使用类似StumbleUpon一样的支持和不支持的投票机制，以确定是否被推荐至头版。同样，虽然有查看相似和相关相关视频，查看来自一些相关用户的视频这样的选项，但还是没有推荐系统使用您的评价和favoriting习惯（和标签您喜欢）。</span></p>
<p><span style="font-size: small;"><strong>博客和微博客</strong><br />
在大多数情况下，博客运用一种综合了最多人浏览、最多人链接、最多评论以及最高评价等各种因素，来做为向你展示你可能喜欢的内容机制。这虽是一个比通过让人们反复试验和发生错误更好的方法，但这并不能确保每个访客都能对他们看到的内容感到满意。例如，在你的博客上，有两篇完全不同主题的博文可能是最受欢迎的，但我可能只会喜欢其中的一篇。与此同时，还必须弄清楚，什么时候开始监控每个独立的用户才是经济且及时有效的？</span></p>
<p><span style="font-size: small;">StumbleUpon是解决了这个问题的&#8217;大家伙&#8217; ，让你<span style="font-family: 'Lucida Sans';"><a id="eolr" title="StumbleThru" name="eolr" href="http://searchengineland.com/070420-000100.php" target="_blank"><span style="font-size: small; color: #006699;">StumbleThru</span></a></span>一个可能有你最喜欢的内容的网站，然而，这一特色，并非适用于所有的网站。</span></p>
<p><span style="font-size: small;">遗憾的是，绝大数微博客网站，还没有任何过滤系统。在twitter及其同类网站中，信噪比的争论异常的激烈。 不过，FriendFeed 发布了一个最基本的推荐功能，简单地展示了一些“最受欢迎”和“最多评论”的链接。</span></p>
<p><span style="font-size: small;"><strong>图片存储和分享网站</strong><br />
当我考虑协同过滤系统的时候，图片分享网站如Flickr和<span style="font-family: 'Lucida Sans';"><a id="z5-v" title="photobucket" name="z5-v" href="http://photobucket.com/" target="_blank"><span style="font-size: small; color: #006699;">photobucket</span></a></span>根本不在我的视线范围内，其中一个原因是我知道大部分使用这些网站的用户主要是为了存储和找一些cc版权的图片嵌入到他们的网站中，不过，我很惊喜地发现flickr已能帮助人们</span><a id="q_h-" title="探索和发现" name="q_h-" href="http://flickr.com/explore/" target="_blank"><span style="font-size: small;">探索和发现</span></a><span style="font-size: small;">一些好的图片。<br />
 <br />
这项对于大多数人可能是熟悉的功能是有趣的，也相当的强劲。它会考虑到如一张图片的推介流量来自哪里，谁在什么时候评论了它，谁收藏了它，又有多少人喜欢它以及其他更微妙的东西。除此之外，该网站还拥有其他一些不寻常的功能，如基于世界地图上地理标记、流行的标签、相关主题、以品质为基础的群体、相机型号和最近上传的探索。</span></p>
<p><span style="font-size: small;"><strong>音乐流和音乐发现网站</strong><br />
将推荐和发现系统结合协同过滤实施最好的例子，我所看到的都是关于音乐流和音乐发现网站。例如，在Last.fm上的实施，我认为接近完美。首先，不管你是使用他们的在线流媒体widget还是他们的客户端，Last.fm会跟踪每首你听的歌曲并收集这些数据。他们每周也会跟踪那些在你的试听列表出现和消失的艺术家们的数据，并使用这些数据为你做个性化的推荐，自动创建一个播放Last.fm向你推荐歌曲的电台。</span></p>
<p><span style="font-size: small;">虽然这本身就足够多的，但并不是到此为止。他们的另一个电台为您播放你通常喜欢听的歌曲，还会给你推荐整个Last.fm社区流行的歌曲，以及一些您的朋友们在听和推荐的歌曲。这是一个非常强大的聚合、过滤并推荐的系统。以下是这个推荐引擎是怎么工作的：</span></p>
<p><span style="font-size: small;"><img src="http://www.readwriteweb.com/images/lastfm_recommendations_july08.jpg" alt="" /></span></p>
<p><span style="font-size: small;">正如你所看到的，他们分析我听的最多的音乐家，然后推荐一些和我经常听的风格和声音都比较相似的音乐家给我。其次是根据我在网站上的好友和一些我加入的音乐群组来给我推荐一些歌曲。</span></p>
<p><span style="font-size: small;"><strong>那么，协同过滤和推荐会消失？<br />
</strong>只有少数一些主流网站运用了这种协同过滤（ CF ）和个性化的推荐——Netflix和亚马逊是最容易想到的两家。正如你从上述中所看到的，如果没有一个推荐引擎（如看到的Flickr ）这当然也有可能是一个良好的协同过滤系统。不过，如果你按照迄今最强健的推荐系统Last.fm那样增加一些推荐功能，对您的用户（因为那样用户体验会更好）和您的网站（因为用户将更多地参与和喜欢您的产品）来说，都是最好的。<br />
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-全文结束———————————————————</span></p>
<p><span style="font-size: small;"><strong>延伸阅读：</strong></span></p>
<p><span style="font-size: small;"><span class="b w xsm"><strong><span style="font-size: xx-small; color: #2200cc;">[PDF]</span></strong></span> <a class="l" onmousedown="return clk(this.href,'','','res','11','&amp;sig2=h5jgY-y4MpvkHJuwCjIW1Q')" href="http://www2009.eprints.org/69/2/wychen_www09_v2.pdf" target="_blank"><span style="font-size: small;"><span style="color: #551a8b;">Collaborative Filtering for Orkut Communities: Discovery of User <strong>&#8230;</strong></span></span></a></span></p>
<p><span style="font-size: small;"><span class="b w xsm"><strong><span style="font-size: xx-small; color: #2200cc;">[PDF]</span></strong></span> <a class="l" onmousedown="return clk(this.href,'','','res','34','&amp;sig2=EgfUZBqylsJ0NgWqpxKn6g')" href="http://www.cisco.com/web/solutions/cmsg/C11-484492-00_Filtering_wp.pdf" target="_blank"><span style="font-size: small; color: #551a8b;">Socially Collaborative Filtering: Give Users Relevant Content</span></a></span><span style="font-size: small;">&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-</span><span style="font-size: small;">这篇文章断断续续地翻译，花了周末两天时间，但是感觉还有很多的语句翻译的不是很好很专业，难免有误导，所以，建议看原文。</span></p>
<p><span class="m"><span style="color: #676767;"> </span></span></p>
]]></content:encoded>
			<wfw:commentRss>http://www.socialbeta.cn/articles/collaborative-filtering.html/feed</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
	</channel>
</rss>
