| |
|
|
| |
| |
| 面向搜索引擎的网站设计(4) |
| 编 辑: 时 间:2008-5-14 9:31:57 浏 览: |
尽可能使用文本,而不是图片显示重要的名称,内容和链接。GOOGLE的机器人不认识图片中的文字。
Make sure that your TITLE and ALT tags are descriptive and accurate. 保证:页面的TITLE和ALT标记正确的精确描述 Check for broken links and correct HTML. 检查坏链并修正这些HTML错误。 If you decide to use dynamic pages (i.e., the URL contains a '?' character), be aware that not every search engine spider crawls dynamic pages as well as static pages. It helps to keep the parameters short and the number of them small. 如果你打算使用动态页面:链接中包含"?",必须了解:并非所有的搜索引擎的机器人能想对待静态页面一样对待动态页面,保持动态页面的参数尽可能的少也会很有帮助。 Keep the links on a given page to a reasonable number (fewer than 100). 让一个页面中的链接少于100个。 批注:用lynx -dump http://www.chedong.com 可以模拟从robot角度看到的页面。其最后有链接统计
输出类似:
[1]Google Free Search _______________________________ Google Search (_) Search WWW (_) Search chedong.com
更 新 [2]站点地图 / Site Map [3]留 言簿 / Guest Book [4]意见反馈 / Feed Back ... References
Visible links 1. http://www.google.com/services/free.html 2. http://www.chedong.com/sitemap.html#sitemap 3. http://www.chedong.com/guestbook/ 4. http://www.chedong.com/formmail.htm ... Hidden links: 50. http://www.chedong.com/bbcweb/ ...
搜索引擎的宗旨在于提取互联网中质量最好的内容提供给用户,任何有利于帮助用户获得相对公正,优质内容的策略都是搜索引擎追求目标。PageRank是一个非常好的策略,但是并非所有策略都是基于非常复杂的算法。 从搜索引擎看来什么是互联网中“好”的内容呢?
首先:互联网大约是8G个网页,而且以每天2M的速度增长的。其中80%以上是动态网页,而占总量20%的静态网页就是一个相对比较简单的过滤规则。 其次:用户友好(User friendly)也是很重要的方面,搜索引擎利用算法帮助提升这些优质网站,包括:通过CSS将内容和表现分离:较少的javascript和frame结构,spider本身也很难深入抓取这些网页:Javascript和frame结构大部分是广告。 标题明确:无标题,重复标题或者标题SPAM(类似于:游戏游戏游戏游戏游戏游戏这样的标题)进行过滤或降低得分页面大小:因为页面过大会导致用户下载缓慢,所以很多引擎只计算页面大小在100k以内的网页。 链接引用:不仅需要有链接链入,也需要帮助用户找到其他更有价值的内容; 文件类型:PDF和DOC等专业文档和来自edu,gov等非赢利网站的内容; 链入网站的文字:所有用户不可见的因素全部被忽略。此外:用户搜索的行为本身也被Google记录,可能对目标网站的主题相关度有帮助。 |
| 上个主题:面向搜索引擎的网站设计(3) |
| 下个主题:网站配色思考 |
|
|
|
|
|
|
|
|
|
|