今天给各位分享走进支撑过8亿用户的 Yahoo! 数据中心的知识,其中也会对走进支撑过8亿用户的 Yahoo! 数据中心进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文导读目录:

1、【雅虎】搜索流量报告(关键词分析)功能已发布

2、雅虎统计(雅虎目前状况)

3、中国雅虎推出雅虎统计服务

4、盘点技术史:流量运营(PC 时代)

5、几大免费统计工具的比较:cnzz、5la、量子恒道

6、走进支撑过8亿用户的 Yahoo! 数据中心

  新的关键词分析工具——搜索流量报告发布   与之前于 2020 年停止提供的关键字分析相比,该功能似乎成为一种超越简单关键字分析的强大营销工具,例如可以看到雅虎商城内的数据等。   “搜索流量报告”功能将会大大改变雅虎购物的使用。   搜索流量报表作为高级统计功能提供,可在“销售管理”→“高级统计”→“搜索流量报表_每日”或“搜索流量报表_月报”中使用。   因为是高级统计升级升职,所以需要设定可以申请促销软件包和使用高级统计的权限。   01   如何使用搜索流量报告   画面如下,可以确认购物关键词排名、每个关键词的销售额、自己店铺的访问量等各种数据。   在初始画面中,显示的行数有限,但当您将鼠标移动到“本店流入获取率”周围并按下箭头展开标记(下图中的红色部分)时,数据就会全屏显示。   可以按类别过滤搜索流量报告,查看类别内的排名,并通过关键字细化查看要检查的关键字的状态。   与其他高级统计功能不同,数据可以保存为 Excel 或 CSV 数据(其他高级统计仅为 PDF)   以CSV格式输出,点击画面右侧的”标记,选择“导出”→“数据”,输出为“Excel”或“数据”。   如果是“Excel”,则以Excel格式输出,如果是“Data”,则以CSV格式输出。   02   中转金额低于实际金额   搜索流量报告中显示的交易金额和订单数量仅适用于同一时段内完成的订单。对于雅虎会话将在 30 分钟后过期。因此,搜索后30分钟内未完成订单的,将不计入中转配送金额。   此外,这是我们的假设,但有可能分配金额中显示的金额仅适用于在类别内搜索时。因为在搜索流入报告的画面中,只要锁定关键词,就会出现以类别为单位的金额,而且出现的金额很低。以市场占有率超过50%的店铺为例,即使按照“经由流通金额”和市场占有率来计算,也有6倍以上的差距。   03   如果您想搜索您感兴趣的关键字   搜索流量报告屏幕按类别显示排名,但如果您想查看特定关键字的排名或销售额,请在“优化关键字”中输入关键字。   04   利用搜索流量报告   搜索流量报告不仅仅是一个关键字分析工具,而是一个非常强大的工具,可以用于雅虎购物的营销策略。   例如:   调查雅虎商城的市场规模和商店的市场份额   每个关键字的“流量分配量”和“增长率”等重要数据,让您了解该关键字有多大的市场规模。此外,您可以通过查看右侧的“自有店铺流入获取率”来了解该关键字的市场份额有多少。   查看关键词候选的排名   如果您在搜索窗口中输入关键字,候选词将显示如下。   候选词越高越被搜索到,但到底有多大差别,到目前为止还不知道。   在搜索流入报告中,在“关键词筛选”一栏中输入想要检查的关键词,如下所示,会显示候选词的搜索排名。   我用几个关键词验证了一下,搜索窗口上出现的候选关键词的搜索次数也比在下面出现的候选关键词低。   因此,对于重要的关键词,建议定期检查候选词的检索次数。   检查关键字的强度   我们经常会犹豫该以哪个关键词来应对某个商品。   例如,商品的形状是“挎包”,但用途是以商务为主的场合,“商务包”也是很重要的词。   也可以按照刚才的“关键词筛选”来查看搜索次数排名。   哪个关键词的搜索次数更多,可以通过关键词排行榜的排名来确认,再通过每个关键词的销售额和流通金额来确认。   但是,不能只根据搜索次数排名来判断,还要在实际的搜索页面进行搜索,将竞争对手的多少、竞争商品的强弱也作为判断材料。   参与是否进行订购进货   进行调查,判断是否进货   因为知道每个关键词的市场规模,可以用于采购的判断。   例如,当你想要购买pixel6a便携手帐时,你会发现它的规模有多大。   这个时候,如果和自己卖的类似商品的关键词进行比较,就能做出更准确的判断。   做调查时,不仅要看流入金额,还要看竞争对手。   *由于图像中的示例已经应用,因此应用按钮显示为灰色。   05   高级统计的权限设置   完成促销包申请后,按照以下步骤设置权限,即可使用高级统计。点击“13设置”中的“权限管理设置”。   *除非您的账户具有企业管理权限,否则您无法点击权限管理设置。如果您无法设置,请咨询对 Yahoo Business Manager 具有管理权限的人员。单击您要为其提供高级统计信息的帐户旁边的编辑。   「14プレミアム統計」にチェックをして、「設定」完成。  【绪论】雅虎统计?全方位攻略,做到心中有数“雅虎目前状况”的内容如下:   1、什么是IP、UV、PV? 2、安了雅虎统计器后怎么看流量? 3、为什么雅虎统计变成量子恒道了? 4、怎么看雅虎商城一个月的业绩数据 5、请问淘宝店铺怎么加雅虎统计器啊? 6、雅虎流量统计准确吗?   顺便说一下PV:   雅虎统计基础数据定义   PV(访问量):即PageView,即页面浏览量或点击量,用户每次刷新即被计算一次。   UV(独立访客):即UniQueVisitor,访问您网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只被计算一次。   IP(独立IP):指独立IP数。00:00-24:00内相同IP地址之被计算一次。   雅虎统计指数(YSR):通过来源带来的PV、UV、IP,以及用户停留时间、访问情况、用户行为等因素综合分析按不同权重计算得到的,评判来源质量的指数,指数越高,表明来源质量越高。   现在大多数的统计工具只统计到IP和PV的层面上,因为在大多情况下IP与UV数相差不大。但由于校园网络、企业机关等一些部门的特殊性,IP已经很难真实的反映网站的实际情况,所以引入了更加精确的UV这个概念。   所有UV与PV对于是使用真实IP上网的用户,数值是相同的。   但是如果访问你的站点中有通过“网络地址转换”(NAT)上网的用户,那么这两个值就不同的。所有对于国内站长来说,这个UV值还是很有意义的。   那么什么情况下UV会比IP少?   一般情况下,统计UV数应该大于等于IP数,但有些情况下,有可能UV数会小于IP数:   1)IP地址是绝对的,从TCP链路上取的,真实的,不唯一的;   2)UV设置的cookie,随机设置的,可重复的,只是重复概率足够小;   3)移动笔记本不时的更换IP,可以导致这种问题;   4)客户端禁用cookie或者客户端安全级别高会导致cookie设置不上,会出现这种问题;   5)如果采用的图片统计,由于拿不到cookie会出现这种问题;   再多说一些东西:   雅虎统计指数(YSR):通过来源带来的pv、uv,ip,以及用户停留时间、访问情况、用户行为等因素综合分析按不同权重计算得到的,评判来源质量的指数,指数越高,表明来源质量越高。   新访客:某客户端首次访问为一个新访客。   最近访客:最近一段时间内访问您网站的客户端。目前显示50条。   当前在线人数:15分钟内在线访问的UV数。   24小时独立IP:指每小时独立的IP地址。因为该数据每个小时是独立的,所以叫24小时独立的IP。   例如192.168.1.10点-1点访问了您网站在这个时段算一个IP。   如果192.168.1.10点-1点再次访问您的网站去重不计算IP。   如果192.168.1.11点-2点又访问您的网站在这个时段也算一个IP。   最高IP:指选择时间段范围内,某日访问IP最多的数值。   最高PV:指选择时间段范围内,某日访问量最高的数值。   日均流量:指选择时间范围内,平均每日流量。(日均流量=总访问量/总天数)   人均访问量:指选择时间范围内,每个访客访问网站的PV数。(计算公式:人均访问量=访问量/唯一访客数)。   访问过程:每个访问者从进入您的网站开始访问,一直到最后离开您的网站,整个过程中发生的一切点击访问行为,称为一次访问过程。   访问入口:每次访问过程中,用户进入的第一个页面为访问入口页面。   访问出口:每次访问过程中,用户结束访问,离开前点击的最后一个页面为访问出口页面。   平均停留时间:所有访客的访问过程,访问持续时间的平均值。   平均访问页数:所有访客的访问过程,连续访问页面数的平均值。   贡献用户数:每个访问来源带来的独立访客数,即UV数;   贡献IP数:每个访问来源带来的独立IP数。   贡献PV数:每个访问来源带来的访客的一切后续访问行为所产生的PV数。   到雅虎统计页面tongji.cn.yahoo.com 输入自己的邮箱和密码就可以查看   量子恒道统计与雅虎统计是什么关系?   量子恒道统计的前身就是雅虎统计。我们在保留雅虎统计原有雄厚技术实力的同时,启用了新品牌——量子恒道统计。量子恒道秉承一贯的信念,将在各个领域提供专业稳定的统计服务。   什么是迁移过渡期?   从现在起到2009年7月31日,是迁移过渡期。这期间雅虎统计和量子恒道统计都提供报表服务。在迁移过渡期结束后,即2009年8月1日起,雅虎统计网站将关闭,量子恒道统计仍继续提供服务。   谁需要迁移?   1.如果您在原雅虎统计添加过统计网站,那么您需要迁移。   2.如果您是雅虎统计的新用户,还未添加过任何统计网站,则不需要迁移,去注册量子恒道帐户即可。   迁移过渡期内雅虎统计有什么功能?   1.您可以正常登陆雅虎统计,查看报表   2.雅虎统计关闭了用户功能,不能添加网站、获取统计代码、设置用户信息、设置权限。在迁移期间和雅虎统计关闭以后,都不再提供如上用户功能。新的量子恒道统计将为您提供添加网站、获取统计代码、设置用户信息、设置权限功能。   我的雅虎统计历史数据会丢失吗?   雅虎统计的历史数据会全部为您保留,在迁移过渡期内,雅虎统计和量子恒道统计中都保留了这些历史数据。但由于雅虎统计系统在迁移过渡期结束后会关闭,因此请您尽早开始使用量子恒道统计查看数据,并更换新的统计代码。   如何开通量子恒道帐户?   1. 如果您是原雅虎统计的用户,请您先登录雅虎统计,按照页面上的提示操作:   a.我们在量子恒道为您保留了与雅虎统计相同的用户名。但量子恒道的账户不会自动启用。当您在雅虎统计处于登录状态并按页面上提示,点击开通量子恒道账户的链接,进入量子恒道账户密码设置页。   b.按页面提示输入并确认量子恒道的密码。   c.提交之后,您的量子账户就已经开通了。请您及时完善您的量子恒道账户信息,特别是请确保您的常用邮箱是真实的邮箱,该邮箱会用于您取回量子恒道密码或者接收重要公告。   2.如果您过去不是雅虎统计的用户,或者您从未在雅虎统计账户下添加过统计网站,您可以直接在量子恒道网站注册。   量子恒道统计提供什么功能?   量子恒道统计提供原雅虎统计的所有功能。如果您曾经是雅虎统计的用户,您之前添加的统计站点的历史数据以及新数据都可以在这里查看,同时量子恒道统计也提供添加网站、获取统计代码、设置用户信息、设置权限功能。   量子恒道帐户可以做什么?   1. 使用量子恒道统计   2. 使用量子恒道论坛   从雅虎统计迁移到量子恒道统计的步骤   1. 开通量子恒道帐户。开通后就可以在量子恒道统计查看报表了。   2. 及时更换统计代码。更换完所有网站的统计代码,就完成了雅虎统计向量子恒道统计的迁移过程。   1、首先打开雅虎商城,登录自己的账号和密码。   2、其次进入主页面,点击商家中心。   3、最后选择统计范围,即可进行查看其一个月的业绩数据。   雅虎统计器已经关闭了,升级成为量子统计器了。现在要10元/月,25元/3月。   如果免费的话,可以用“好店铺”,“辣帖”等   旺铺的统计器,一般都是放在分类里的。建立一个分类,然后再图片的地址栏,填入代码就可以了···   一般店铺的统计器,是放在滚动的广告栏里的。把编辑状态转为编辑源代码,把网站提供的源代码放到里面就可以了···   雅虎统计的功能比较多,不过好像要把统计代码放到每一个页面,才能统计到每个页面上的情况。我在威鹏的网店上的公告栏和每个商品都装了雅虎统计,那个劳动量还真大。不过不同的统计分析系统的算法机制不同导致不同的统计工具统计数据也不相同。统计代码放置的位置和前后顺序不同也会导致分析结果的不同,还有网站自身的访问速度也会对此造成影响。所以没有绝对准确的统计工具。  中国雅虎又推出了一项新的产品,雅虎统计,有兴趣的话可以体验一下。   这里是地址:雅虎统计   这里是演示:雅虎统计演示   雅虎统计:   免费网站流量统计分析系统。通过统计分析大量数据, 结合网络营销,为您提供运营, 广告投放, 推广等决策依据。用户包括个人站长, 个人博主, 网站管理者, 第三方统计等。   以前我一直向大家推荐google的站长工具Google Analytics(分析),因为他的功能确实很强大。在Google Analytics(分析)改版以后,界面和功能也更加直观,更方便实用。有兴趣的话也可以体验一下,和雅虎统计做个对比。  简介: 流量分析只比互联网诞生晚几年,作为一个生态,互联网需要有人提供服务,同时也需要有人消费服务,而在互联网上经营服务跟在线下经营五金店一样,如果想要成功,需要时刻关注来访问的顾客的情况:今天有多少人来消费?有多少人来了但是没有购买?我的顾客有一些什么特点?为什么今天的销售额比昨天少了很多?   提到流量运营的历史,我们首先需要简单介绍一下互联网的历史。人类最伟大的构想往往都需要几代人不断地尝试和完善,蒸汽机如此,飞行器如此,攻克癌症也将如此。从1876年贝尔发明了电话起,整个20世纪人类都在不断尝试如何远距离传输除语音以外的信息或者数据,从20世纪初特斯拉即已经有了互联网的构想,同时Otlet等一大批先驱在不断探索和完善信息的数字化存储和读写技术,1960年MIT教授Licklider提出“IntergalacticComputerNetwork”即IGCN理论,为现代互联网概念奠定了基础。直到1990年,现代互联网才真正诞生,英国人TimBerners-Lee提出并成功实现了基于客户端和服务端之间通信的HTTP协议。   流量分析只比互联网诞生晚几年,作为一个生态,互联网需要有人提供服务,同时也需要有人消费服务,而在互联网上经营服务跟在线下经营五金店一样,如果想要成功,需要时刻关注来访问的顾客的情况:今天有多少人来消费?有多少人来了但是没有购买?我的顾客有一些什么特点?为什么今天的销售额比昨天少了很多? 1993年,在互联网诞生3年后,全世界有大约600个网站,如果你有幸成为这600个提供互联网服务的网站主之一,要回答这些问题就没有这么容易了,首先你面对的是你的服务器上的一大堆服务请求日志,大概长成这样:   如果你不是学计算机专业的,基本不大可能从成千上万的日志中获得任何有用的信息。有了痛点自然就有解决痛点的产品诞生。此时,历史的潮流将一家叫WebTrends的公司推向了沙滩,这家公司今天依然存在,当然技术上早就与时俱进了。然而,在1993年,它仅仅为网站主提供了一个简单服务端日志解析和分析的服务,可以认为就是设计了一个grep语句将这些日志的IP地址信息提取出来去重,然后告诉网站主今天有多少人访问了网站。这家公司因为这个idea在2001年卖了11亿美元,同时这个idea催生了一个叫digital analytics(流量分析)的行业的诞生,并且每年产生上千亿美元的revenue。   1995年是互联网发展的重要一年,Amazon, Craigslist, eBay领头的电子商务开始进入互联网,http://Match.com也将社交需求带到了网上,Yahoo在之前一年已经上线,随着互联网服务的日益丰富和多样化,Windows 95的火爆登场,个人电脑大卖,网民数量也出现了爆炸式增长,WebTrends已经无法满足大的网站主洞察客户的需求。   此时诞生了Analog,一款免费的流量分析工具,并且提供一定的可视化分析能力。当然,到目前为止,互联网网页还是以静态页面为主,如果一个用户访问了某网页,我们可以认为他访问了整个网页的所有内容,现在我们知道,这个假设很快就变成了不对的。 1996年,专业的互联网市场营销团队开始出现在一些大公司的组织架构中,他们可以熟练使用Analog这款免费工具,然而免费的工具在没有营收的支撑下总是难以满足高阶用户的需求。此时更多的玩家进入了流量分析领域,帮助网站主洞察流量和挖掘客户价值,大的网站主也开始大量投资购买流量分析软件对服务端日志进行分析。此时流量分析的四巨头出现:WebTrends, Web-counter, Accrue, Omniture。其中Web-counter开创了一种广为人知的的hit counter service, 它反向为之,针对中小网站主和在免费host网站host网页的个人网站主(他们没有读取服务端日志的权限),国内的80后互联网使用者可能并不陌生。 它的划时代意义在于让所有的网站主都可以做最直观的流量洞察,真正让流量分析做到了零门槛,网站主不需要懂如何读取服务端日志、不需要懂日志管理、不需要懂日志解析,只需要在网站里面嵌入一段简单的PHP代码即可。当然它没有fancy的分析功能,也没有任何过滤爬虫的能力。   1997年,互联网持续迭代发展,此时的网站开始注重美观,各种精装修技术开始盛行,动态加载的网页技术开始出现,服务端请求的次数跟网页的浏览次数也基本没有任何关联了,服务端日志分析已经不能精确地洞察用户行为。此时一种新的用户行为追踪技术诞生,叫做Javascript Tagging。它可以精确地追踪复杂网页的用户访问行为,tag原来是指网络请求的那张看不见的照片,它被有意嵌入在网页内的某兴趣点,当指定的用户行为被触发时会向服务器请求这张图片资源,顺便将相关的用户信息随着请求带上去。随着网页技术的发展,现在tag是指一段用来追踪用户行为的复杂的Javascript代码。除了能够进行更加细粒度的页面元素追踪外,tag还能收集到更加复杂的内容,比如购物车内的商品信息、屏幕有多大、使用了什么浏览器、视频看了多少 等等。值得注意的是,http://google.com在这一年上线,之后十几年互联网技术的重大发展基本跟它有点关系。   这家公司最初在1995年创立,进入前面提到的基于服务端日志解析的流量分析服务,1997年开始发展Javascript tagging技术,到1998年,JS tagging还是将日志发送到业务服务端进行日志分析为主,其主要原因是各大互联网公司都已经投入大量资金购买流量分析软件,成本的压力让这些公司暂时还不考虑转型,此时最大的软件提供商就是Urchin,但是同时一种新的商业模式开始诞生,网站的流量数据不再发到自己的服务器,而是发送给专业的流量分析服务商管理的服务器,流量分析开始SaaS化,这种解决方案在中小企业中非常流行,同时大的host公司(为中小企业或者个人提供网站托管服务)也对此趋之若鹜。新的商业模式结合了流量分析的易用性和功能性,让Urchin成长成为了最大的流量分析服务提供商,并于2005年卖给了Google,成为了Google Analytics。   接下来从2005年到现在,流量分析从主流的Page View过渡到了in-page analytics, 再到Universal Analytics(移动互联网的兴起),再到各种纵深流量分析和运营能力构建(cross-site、machine learning、lifetime value等),流量运营出现了百家争鸣的业态。   1994年4月20日是中国互联网发展史上开天辟地的大日子,通过一根64Kb(注意是bit不是Byte)的国际专线,中关村地区教育与科研示范网络(NCFC)工程完成了与国际互联网的全功能IP连接。这一年5月中国科学院高能物理研究所设立了国内第一台WEB服务器“中国之窗”,服务于科研与教育的互联网用户主要是北京的科研院所和高校的人员。 随后两年多时间里,中国科技网(CSTNET)、中国公用计算机互联网(CHINANET)、中国教育和科研计算机网(CERNET)等相继开工建设,开始了全面铺设中国信息高速公路的历程。1996年中国第一个网吧(电脑室)在上海出现,上网价格达40元/小时,上网冲浪只能是少数人的高科技休闲方式。1997年中国电信面向普通家庭推出价格较为低廉的163网(很容易猜到后来网易选用http://163.com作为域名的缘由)和169网,全国各地的网吧如雨后春笋般涌现。1998年中国网民开始成几何级数增长,上网从前卫变成一种真正的需求,一场互联网带来的变革很快传遍整个中华大地。 随着上网的普及,提供上网内容的ISP也越来越多,但以复制海外的模式为主,美国出现什么新网站,中国会很快拷贝过来,一开始目标肯定是精英,3年后才会真正开始爆发流行。这个阶段逐步诞生了占据中国互联网黄金十年的三大门户:网易、搜狐、新浪。这里不展开介绍它们的业务发展和上市历程,从流量运营角度我们来看导航站和中国站长的发展,他们成为这个时代中国互联网的特色之一。 在互联网网站鼻祖雅虎刚上线时,以网站分类导航的形式提供内容服务,后来逐渐发展成搜索、门户等产品。同样得入口者得天下,中国互联网也出现了简单到基本不需要技术的导航站,这与中国网吧和网民特点密不可分。1999年还是网吧管理员的李兴平,发现找资料很困难,而且要记住英文网址难度很大,他就把中国排名前5000位的站点进行分门别类,再按用途组合在一起,做成一个“网址大全”式的网站,这就是hao123网址之家的前身。他要逐个检查链接,去除死链和非法链接、调整链接排序,工作耗时逐渐增长到每天需要6-7个小时,这就是中国站长的早期人工流量运营。 2004年hao123成为众多网吧和家用电脑的开机首页,甚至在全球权威的Alexa网络监测中,成为全球流量极大的中文网站之一。根据百度的统计,来自hao123的搜索请求广告占到整个百度的搜索量的1/10,而整个网站流量能占到百度的40%,因此这一年百度斥资1000多万现金加股票收购了hao123。蔡文胜创办的比hao123晚了4年的http://265.com也在2007年卖给的谷歌中国。   随着这两家被收购,网址导航的盈利模式被认可,进入了群雄争鹿的高速发展期,360依靠海量的安全卫士和浏览器装机量捆绑推广360网址导航,瞬间挤入了网址导航的第二阵营,2345依靠与热门网络应用捆绑以及强大的地推资源迅速崛起,114啦依靠与自身雨林木风盗版系统推广结合也获得大量的用户,随后的搜狗、QQ也都相继推出了自身的导航网站,网址导航逐渐成为各大公司的标配流量入口。   言归正传,在没有云计算和大数据的时代,搭建和运营网站的门槛却是极低的。国内出现了很多提供价格低廉设置免费的个人空间和二级域名服务的网站,催生了一大批站长,提供各式各样的论坛和网站。他们开始学习如何用asp、php、html和css来装修完善自己的网站。比如提供统计服务的就有热讯统计,itsun等,其中在站长服务中最有名的当属网易了,提供了免费域名、主页空间、易数统计整套方案,虽然有广告但做个初级网站还是非常容易。网易这家公司让人佩服的是,每个时代都能低调做出符合用户需求的产品,诸如门户、163邮箱、梦幻西游、网易云音乐、考拉海购都成功收获大批用户。   基础设施有了,如何提升网站访问量成了站长们关心的首要问题。在搜索引擎流量未成为主流时,统计排行榜和换量联盟(太极链、51link等)是站长们关注的重点。甚至在2005年蔡文胜举办的第一届中国站长大会上,站长们交流网站流量运营经验的同时,也在交流在各个平台刷量的葵花宝典,可见中国站长对商业化和盈利的渴望。   这个时期的统计分析工具,已经进入了基于服务器日志解析的流量分析的技术架构,除了统计网页PV、UV的这些基础指标外,做网站运营最关注的就是流量来源。通过用户来源网站统计,可以了解用户来自哪个网站的推荐、哪个网页的链接,如果是通过搜索引擎检索,可以看出是来自哪个搜索引擎、使用什么关键词进行检索,以及你的网站索引出现在搜索结果的第几页第几项。这些分析对于站长去做SEO尤为重要,所以这里展开介绍一下来源和关键词分析的技术原理。 通常有两种技术来实现来源分析,一种方案在来源页面链接加自定义参数来标注用户来源,比如在hao123首页点击百度连接后会打开http://baidu.com/?,tn参数就是标识来源的字段。 另一种方案通过http header中的referer作为来源,比如你在百度搜索网站hao123(记为链接A:http://baidu.com/s?),点击跳转后,hao123的首页(记为链接B:http://hao123.com/)就可以通过document.referer来获取来源为(记为链接C:http://baidu.com/link?)。 前一种比较适合在网站内部页面跳转中来使用,因为需要所有来源都加上相应参数;第二种更适合分析站外流量来源,往往referer的url参数会比较长,分析来源网站会截取域名段,分析来源页面时通常会取?之前的静态URL。理论上链接A就是B可以获取到的referer,也是说A=C,这样B就可以分析来源于搜索引擎的关键词了(A链接中带了搜索关键词“wd=hao123”),这就是统计分析产品中提供关键词分析的基本原理。但实际上A和C差异很大,这是为什么呢?懂点浏览器知识的观察下就明白,其实在链接A页面上点击时并没有直接跳转到链接B,而是加了跳转中间页链接C,链接C也是百度的网页,可以很灵活地控制URL中携带的参数,屏蔽目标网页C做关键词分析。 Google早在2011年推广搜索https化时开始屏蔽来源关键词分析,国内的百度是在2015年发布公告正式取消referer中关于关键词的显示,宣称此举能够更好的保护站点流量关键词数据信息,使站点数据更加私密化。私密化的结果是你只能在百度统计分析中看到关键词分析,你懂的:)   2005年后谷歌的Google Analytics和雅虎量子统计逐步进入中国,站长们见识了国际一流公司的产品。但技术实力不是占领市场的第一要素,有时体验更重要,由于国际化的产品设计理念,加上糟糕的中文翻译质量,给了国内流量分析产品不少机会。国内的创业者逐渐推出了51la、51yes、cnzz等中国第二代流量分析产品,也提供了实时在线用户统计等差异化的功能。这个时期很多站长会同时集成Google Analytics和国内流量分析工具,使用各平台的特色功能的同时也可以核对各平台数据是否一致。后来51la、51yes由于服务稳定性一直被诟病,广告过多和产品功能规划不明确,逐渐被cnzz拉开差距。cnzz将自己定位为专业、权威、客观的第三方数据统计,这迎合了国内互联网市场的巨大需求,到2008年上线4年的cnzz获得了60多万的站点用户,当时据CNNIC统计国内网站数量在192万,意味着cnzz已经覆盖了国内三分之一的站点。   百度统计测试版在2007年11月发布,2009年8月发布正式版,商业公司提供的统计服务更加稳定、安全、专业,在2010年逐渐成型后一统江湖,成为国内流量分析工具百家争鸣时代的终结者。随着国家工信部加强对域名和内容的备案审查,中小站长开始衰落,cnzz市场份额也逐步降低,网站流量分析工具也跨入被搜索引擎寡头(百度、Google)统治的时代。   移动互联网兴起,移动统计分析迅速崛起,Flurry和友盟在中美各领风骚,TalkingData、神策、阿拉丁等后期之秀异军突起。   作者:DeeperMan   原文链接   本文为阿里云原创内容,未经允许不得转载。  三、量子恒道:   首先说明的是量子恒道统计是阿里巴巴旗下的,是过去的雅虎统计的化身。对于我来说,量子恒道统计没有太大的优势,竞争力不及前两个。但是我之所以把它列出来,不是要让大家都去用,而是为了更好的阐明统计工具对于我们站长的用武之地。   我们从上图看到,阿里的统计没有分栏目,而是将所有功能直接放在一个版面里,去除了一些功能,保留的主要功能。但是,其中最为重要的功能有:搜索引擎分析、关键字、详细来源、地区、被访问页面。功能较少,基本上都被其他两个统计囊括,但麻雀虽小五脏俱全。   网友对以前的雅虎统计的评价是基本上不影响网页打开速度。   四、综合比较:   首先撇开网友的评价,只要不太影响速度,在我们接受范围内就好。我们再来考虑一下各个统计工具后台界面,不考虑广告,cnzz以折线图、饼状图和表 格为呈现方式;5la则以柱状图、饼状图和表格为呈现方式;量子恒道和cnzz一样。在界面清洁度上当然是量子恒道最清洁,其次是5la。   结论:   我们在使用统计工具的时候主要是考虑统计工具对我们网站数据的分析的有用程度,即我们能否从该统计工具中获得我们想要的数据,并能根据这些数据反应的问题及时调整,做得更好。   对于我个人而言,我想要的数据有:每日的和昨日的综合数据,可以对一天的概况有一个一目了然的认识;近期网站流量的变化,看看是不是网站被搜索引擎 处理了;搜索引擎和关键字分析;访问来源页面,访问入口页面,出口页面等等跟站内内容直接相关的数据,这些数据可以看出站内的内容哪些是最受关注的,另外 也可以知道自己的页面流量主要从何而来,据此做好页面工作;访问地区、访问者方面的统计。其中有一项数据以上三个统计工具好像都没有,我希望获得更具体的 数据,追踪每一个访问者在我页面的经历:他从哪个页面过来,进入哪个页面,停留多久,是否进入到其他页面,最后出站是在哪个页面,之后有没有回访。   行文至此,我们应该理解作为统计工具,只有更好没有最好的道理,所以我们的网站往往可能挂上两个统计工具,为的是既要有比较,又获得更全面的统计功能。好了,以上拙见仅供参考,如有不对的地方还要大家指正。   文章出处:http://www.utubon.tk/freesrc/2010-10-08-statistical-tools-complete-anylsis.html  Yahoo!是一家全球知名的互联网公司,拥有过8亿的活跃用户,提供了60多个全球化产品,分别部署在20多个国家或地区的数十万台服务器之上,然而雅虎全球的运维团队却仅有数百人。   下面,我们通过雅虎北京全球研发中心高级系统运维工程师刘元概述的三个方面来了解雅虎的技术运维体系,剖析超大规模网络应用的运维挑战,走进Yahoo!数据中心!   基础设施   “工欲善其事,必先利其器”——需要支撑超大规模的网络应用,超大规模的全球基础设施是必不可少的。所以我们先看Yahoo!数据中心和全球的骨干网络有哪些特别的设计和考虑,来帮支撑超大规模的互联网应用。   首先通过两张图片(图1)来了解Yahoo!数据中心。我们的数据中心大多是自主设计和建造的,尤其在北美地区,我们自主设计并建造了三个超大规模的数据中心。这三个数据中心初期设计的容量均为20兆瓦,大概可容纳25000到30000台服务器及相应网络设备,并均有能力通过后续容量扩展至50兆瓦以上。   如果有参观过国内数据中心,或者有数据中心建设经验的同学可能会有所了解。影响数据中心建设的最主要因素往往不是网络带宽,而是电力和制冷。所以,雅虎通过近20年的经验积累,在这两方面沉淀了大量的专利技术以提高数据中心的密集度。我们自行设计机架及其电源模块以保证所有机架都能满负荷工作,同时实现所有电源的远程网络控制,这样可以有效的提升可维护性,降低现场工程师的工作负担。满架的服务器机架还有另一个好处:所有的服务器都是前吸冷风,后排热风,我们将服务器机架相对排列(面对面,背对背),这样就可以实现冷热风道的隔离,甚至完全密封热风通道,促使冷空气在均匀通过所有服务器散热后,由热风通道排出。这样不仅降低了制冷面积,还提升了散热效率。通过建设超大规模的数据中心,我们不仅增加了数据中心的密集度,提升了单个数据中心的计算能力,满足了日益增长的超大规模应用需求,同时还能提升数据中心现场工程师的管理效率,降低维护成本。此外,我们也不断聚焦新技术的采用以降低能源消耗。我们数据中心通过精心的设计,实现PUE(能源使用效率=总体能源消耗/IT设备能源消耗,越接近1代表能源效率越高)仅为1.08的业界领先水平。   除了数据中心是我们自行设计并建造的,我们全球的骨干网络也是自主设计。我们通过自行铺设光缆或租用运营商网络,构建了自己的Yahoo!全球骨干网。所有的网络设备都由我们的网络运维团队管理,核心网络均是多链路冗余,实现单点网络故障的自动转移,而不依赖网络运营商提供的SLA。   图2全球骨干网络示意图(不代表Yahoo!全球骨干网络设计)   我们的全球骨干网络均为高带宽互联,区域内我们提供10Gbps-40Gbps乃至北美地区的200Gbps互联带宽,洲际间也提供20Gbps的多链路冗余。骨干网络主要是传输雅虎内部数据,分发应用所需的数据到全球所有数据中心,收集全球用户访问数据到后端计算网格进行汇总和计算。   Yahoo!全球骨干网络除了与传统运营商网络互联互通,以方便最终用户能通过其运营商网络快速接入雅虎的各项服务,同时我们还与其他的大型互联网公司有交换网络连接,这样我们与其他大型互联网公司间的数据交换(如邮件数据交换)即可通过我们的交换网络传输,不再依赖于运营商网络。这样不仅提高了交换能力,更大范围降低对网络运营商的依赖性。   技术生态圈   有了世界顶尖的硬件环境,软件环境也不可少。下面我们着重介绍下Yahoo!的技术生态圈,看看Yahoo!使用了哪些产品和技术来支持大规模网络应用。   在雅虎内部构建一个超大规模应用其实并不是那么的复杂,因为我们已经提供了一整套完整的技术体系来帮助开发人员快速建立起一个具有高可维护性的超大规模应用。   图3 Yahoo!数据中心技术生态圈   从这张图我们可以看到一个新应用在生态圈里和现有技术平台的关系:   新应用(APPLICATION)只需要更多的关注自身的业务逻辑。与应用密切关联的本地信息,我们有一些本地存储(LOCAL STORAGE)技术来供应用使用,比如关系性数据库MySQL、Oracle,存储Key-value型数据的MDBM和Memcache。另外,雅虎还提供了大量的平台服务(PLATFORM SERVICES)供我们各种应用使用。比如统一验证平台YCA来完成所有应用内及应用间的身份验证,统一防御平台Ydod来帮助我们识别并且隔离恶意/滥用的流量,用户信息服务UPS可以让应用方便的获取这个用户的相关信息,如地理位置,兴趣喜好等。个性化内容推荐服务Slingstone,可以直接向用户提供个性化的雅虎内部及合作伙伴的内容信息。另外新应用还能方便快捷的接入广告平台(AD SERVER),获取个性化推荐的广告。前端应用收集到的各种应用相关信息(如浏览点击数据),通过我们构建在全球骨干网络之上的数据高速公路(DATA HIGHWAY)这一统一数据通道,及时地回传到雅虎全球最大的商用Hadoop群集。在Hadoop群集上不同应用及平台服务根据各自的需求,处理对应的数据,并将处理好的数据在通过雅虎全球骨干网络分发到各个数据中心的服务端,以方便前端应用的调用。同时Yahoo!在云端(THE CLOUD)还提供共享的云存储(STORAGE),以方便全球化应用的同步和调用各种共享数据。   除了这些常见的技术来帮助快速构建超大规模应用,我们还提供了大量的技术和产品来进行高效的运维和管理:   主机信息管理系统:通过主机信息管理系统管理所有系统硬件信息,如CPU、内存、硬盘、网卡地址、Console接口、电源接口、物理位置等。   角色配置管理系统:主要是把主机根据角色分成不同的组,不同角色的主机会应用不同的配置。不同角色的主机有不同的运维团队、系统配置、应用配置等。   网络设备管理系统:包括交换机上的访问控制列表、负载均衡设备的配置、全球负载均衡配置,以及访问状态数据的统计。   统一的监控平台:用于从不同层面进行监控,我们有所有主机系统数据的监控,也有基于服务可用性的监控。然后我们也有访问量、访问延时等应用层面的数据监控,并可以和历史数据进行比较。   所有的这些平台大多都是雅虎运维团队自行开发和维护的,更贴合Yahoo!的使用体验,帮助对超大规模的主机进行统一和高效的管理。   运维团队   前面的两条分别是硬件和软件环境,除了一流的硬件和完备的软件环境,能够实现高可用性大规模应用的核心,还是人。所以我们在最后,会给大家介绍雅虎的全球运维团队是如何工作的。   在Yahoo!我们的运维团队除了基础设施的Operation团队,如数据中心现场工程师(SiteOps)、网络运维工程师(NetOps)、基础设施(DNS、DHCP等)运维团队(InfraOps)和安全团队(Paranoid)等。我们还会按照产品线划分出Service Engineer团队,来支持这项产品的应用运维。   SE(Service Engineer)团队和大部分公司的系统运维工程师一样,会负责生产系统维护,如部署应用、监控报警、配置管理、变更管理及故障管理。除此之外,在雅虎SE团队会更多的深入了解应用。   图4 团队协作   从产品设计之初,我们就会和产品经历及研发团队共同讨论系统架构设计,确保开发团队将要实现的是高可用性、高可扩展性及高可维护性的产品。产品测试阶段,我们也会和测试团队保持密切的沟通,使测试环境能够最大程度模拟生产环境的各种场景,以保证我们产品经过了完整有效的测试。系统上线前,我们还会和各个团队评估整个产品的可维护性,并确定应用的容量规划及其故障转移策略,确保SE团队充分了解如何在生产环境中维护该项产品。由于不同的团队可能在不同的国家和地区,所以只有更紧密的全球化协作,才能为用户提供一个高可用性、高可维护性的全球化产品。   产品上线以后,才是产品整个生命周期的开始,我们需要确保产品在其设计的生命周期内,都能够按照我们的预期提供高可用性的服务。所以在日常维护中,我们会和产品及研发团队一同分析产品运行状态,分析总结各种故障,不断的修正已有的Bug,提供新功能的建议与意见。根据各地用户分布及产品的运行状态,修正我们的容量规划及故障转移策略,进一步提升用户体验。   结语   以上只是雅虎在超大规模应用运维体系的简单概述,并没有太多的技术细节,瑾作抛砖引玉之用。雅虎全球运维团队的工程师利用他们的智慧,不断创新,一一应对各种挑战,完成一个个不可能完成的任务。   Via CSDN   原文链接:http://www.yseeker.com/archives/10582.html
走进支撑过8亿用户的 Yahoo! 数据中心的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于走进支撑过8亿用户的 Yahoo! 数据中心走进支撑过8亿用户的 Yahoo! 数据中心的信息别忘了在本站进行查找喔。

未经允许不得转载! 作者:谁是谁的谁,转载或复制请以超链接形式并注明出处

原文地址:http://dl-meter.cn/post/21578.html发布于:2026-03-18