SEO : Từ đầu tiên, nhiều người quan tâm nhất và cũng hay bị lầm lẫn nhất là SEO. SEO là từ viết tắt của Search Engine Optimization - dịch nôm na là tối ưu hóa website cho việc nâng thứ hạng web trên các cỗ máy tìm kiếm. Với khái niệm này, rất nhiều người làm kinh doanh trực tuyến thường đánh đồng SEO chính là Quảng bá website. Sự thật không phải vậy. SEO chỉ là một trong những công đoạn cơ bản và bắt buộc trong cả quá trình quảng bá một website trên hệ thống tìm kiếm. Để SEO một website, các webmaster thường phải sử dụng một số công cụ như phần mềm chuyên dụng hay các công cụ có sẵn trên Net để đo chỉ số Title, Keywords, Description, Body text, H1, H2,…H7, Các thẻ Alt, thẻ Images, Thẻ Robots, Refresh, Topic,…. và vô số những thông số kỹ thuật khác. Nguyên tắc chính của việc SEO một website là phải làm mọi cách để từng trang web và cả website chạy nhanh hơn, ít lỗi kỹ thuật hơn, mã nguồn trong sáng hơn, ít script hơn và đặc biệt: Không có các lỗi bị hệ thống tìm kiếm cho là kỹ thuật Cloaking - kỹ thuật đánh lừa các cỗ máy tìm kiếm. (Xin tham khảo bài: Các tiểu xảo trong quảng bá website). SES - Search Engine Submission: Đăng ký website vào các cỗ máy tìm kiếm. Thuật ngữ này cũng rất được quan tâm vì đây là cách đơn giản và nhanh nhất giúp một website mới ra đời có thể được liệt kê trong danh bạ của các cỗ máy tìm kiếm. Các webmaster dạng này thường sử dụng một phần mềm chuyên về SES như AddWeb Promoter, Hello Search Engines, Dynamic Submission,… để đăng ký website vào hàng loạt cỗ máy tìm kiếm. Nhiều webmaster rất tự hào với những phần mềm dạng này khi cho rằng mình đã đăng ký website của mình (và cả của khách hàng) vào hàng ngàn - thậm chí hàng triệu “cỗ máy tìm kiếm” chỉ bằng một vài lần nhấn chuột - và phần mềm sẽ làm thay toàn bộ. Sự thật có đơn giản như thế? Hãy lấy Google, Yahoo và MSN làm ví dụ: Để đăng ký vào 3 cỗ máy này, bạn bắt buộc phải làm động tác: nhập mã số an toàn (đối với Google và MSN) hoặc đăng nhập tài khoản (nếu đăng ký vào Yahoo). Đây là việc chỉ con người mới làm được - không có một phần mềm nào đủ khả năng làm thay. Chưa hết, hiện 3 cỗ máy này đang chiếm thị phần tìm kiếm áp đảo với chỉ số: Google + Yahoo + MSN chiếm xấp xỉ 85% chỉ số tìm kiếm toàn thế giới. Ngoài ra, các Search Engine khác như AOL (sử dụng kết quả của Google), Altavista, Alltheweb, Inktomi (sử dụng kết quả của Yahoo), Ask/Teoma, Lycos, HotBot và Dogpile chiếm khoảng 14,5% thị phần còn lại. Như vậy hàng “ngàn”, hàng “triệu” “cỗ máy tìm kiếm” còn lại chỉ chiếm thị phần xấp xỉ 0,5% ! (Tham khảo: Đăng ký website vào Google, Yahoo, MSN và Ask/Jeeves). Đăng ký thủ công là cách làm đúng và cần thiết nhất để website của bạn sớm được nhận diện trên hệ thống tìm kiếm. Về cách đăng ký, xin vui lòng tham khảo bài viết: Đăng ký website vào Google, Yahoo, MSN và Ask/Jeeves. SEM: Search Engine Marketing. Đây mới chính là cái mà các nhà quản trị website và người kinh doanh online nhắm đến. SEM chính là tổng hợp của tất cả các công đoạn nêu trên, gồm: tối ưu hóa website, đăng ký website vào hệ thống tìm kiếm và các thư mục internet, đặt liên kết với các site khác (trong đó bao gồm cả việc mua liên kết bằng cách đặt logo, banner quảng cáo) và nhiều việc làm khác nữa nhằm giúp website trở nên thân thiện hơn với các cỗ máy tìm kiếm để thứ hạng các từ khóa trong website ngày càng được cải thiện, website có nhiều người truy cập hơn. Keywords: Từ khóa - những từ mà webmaster hoặc chủ nhân trang web cho là quan trọng đối với website của mình. Thường, mỗi website được chọn ra những từ đơn hay cụm từ nhau làm từ khóa. Ví dụ, trang web về du lịch thì các từ vietnam travel, vietnam tours, …; website về giải trí thì các từ: âm nhạc, phim ảnh, giải trí, am nhac, ca sy, nguoi mau, thoi trang,… thường được chọn làm từ khóa. Thời gian trước, từ khóa là vấn đề sống còn đối với một trang web. Nhưng nay với giải thuật mới từ các cỗ máy tìm kiếm thì từ khóa chỉ đóng vai trò thứ yếu. Link Back - Link popularity: Mức độ phổ biến liên kết. Một website được đánh giá cao tại Google hay Yahoo khi nó có nhiều liên kết từ các website khác đến. Tuy nhiên, không phải cứ có nhiều liên kết là tốt vì nhiều liên kết hoàn toàn vô nghĩa vì nếu bạn liên kết đến một website bị liệt vào black list (danh sách đen vì đã sử dụng công nghệ spamming) hoặc một trang web quá ít người truy cập hay không đúng chủ đề thì lợi bất cập hại. Website của bạn có thể bị đánh giá là “cùng hội cùng thuyền” với các website kia và như thế, nguy cơ website của bạn bị rớt hạng là rất lớn. Ranking, PageRank: Với ranking, thì Alexa đang chiếm uy tín tuyệt đối vì tính chính xác và độ tin cậy. Một website có thứ hạng Alexa ranking cao đồng nghĩa với việc website đó được nhiều người biết đến, nhiều người truy cập và nó cũng dễ dàng được tìm thấy với vị trí cao trên hệ thống tìm kiếm. PageRank là một công cụ đo đếm số link back của một website bất kỳ. nếu website của bạn có PageRank cao thì cũng đồng nghĩa với việc website được truy cập nhiều hơn nhờ người truy cập bấm trực tiếp vào link (hay banner, logo) để đến website của bạn và hệ thống tìm kiếm cũng ưu ái với bạn hơn. Search Engine: Là các cỗ máy tìm kiếm như Google, Yahoo, Msn,… Những cỗ máy tìm kiếm này sử dụng một phần mềm gọi là Robot, hay Spider, hay Bot hoặc Crawler để tự động index và lập chỉ mục tất cả các website trên đường chúng “bò” qua. Sau đó, những thông tin này được gửi về Data Center của cỗ máy tìm kiếm để xử lý, sàng lọc, phân loại và đưa vào lưu trữ. Khi một người dùng internet cần tìm một nội dung, họ sẽ đánh từ khóa và nhiệm vụ của cỗ máy tìm kiếm là lục tìm trên danh bạ của nó các kết quả liên quan (đã lập chỉ mục trước đó). Công việc này được tiến hành hoàn toàn tự động và có thứ tự ưu tiên khác nhau cho từng site khác nhau. Các site tốt, giàu nội dung (như các trang báo điện tử, các blog lớn, các diễn đàn đông thành viên) sẽ được index thường xuyên hơn. Chính vì vậy, kết quả tìm kiếm thường tươi mới đối với những site lớn. Internet Directory: Đây là các thư mục internet giống như kiểu Trang Vàng của Việt Nam. Những thư mục này chứa đựng rất nhiều website theo từng danh mục, từng chủ đề các nhau. Khác với các Cỗ máy tìm kiếm - các thư mục internet không hoạt động tự động mà thường do người quản trị cập nhật thông tin thông qua bản đăng ký của các chủ website gửi đến. Nếu website của bạn có mặt tại nhiều thư mục internet thì ranking, pagerank và cả vị trí trên các search engine cũng cao hơn. Internet chứa hầu như tất cả những thông tin liên quan tới mọi lĩnh vực, mọi ngõ ngách trong cuộc sống. Nhưng nó rất rộng, rộng đến mức gần như không ai có thể kiểm soát được. Diện mạo của Internet lại thay đổi quá nhanh chóng và mạnh mẽ. Hạt nhân của Internet là Word Wide Web, với số lượng lên tới hàng chục tỉ trang, được lưu trữ trong hàng triệu server đặt khắp nơi trên toàn thế giới. Có thể ví Internet như một biển dữ liệu khổng lồ, với muôn vàn những viên ngọc quí nằm giữa các hạt sạn. Trong đời sống hàng ngày, nhu cầu tìm kiếm thông tin đóng vai trò vô cùng to lớn, và một trong những vấn đề bức thiết nhất của công nghệ hiện nay là làm sao “đãi cát tìm vàng”, khai thác nguồn tài nguyên này một cách hợp lí, đem lại lợi ích tốt nhất cho con người. Tìm kiếm thông tin trên mạng Internet quả thật là một thách thức lớn lao. Nó không giống như việc bới các hạt đỗ đen nằm lẫn lộn trong thùng gạo, bởi dữ liệu trên mạng Internet do con người đưa vào, chúng cũng có cấu trúc và tổ chức xác định (mặc dù thiếu tính nhất quán), trong khi đó thì các hạt đỗ đen lại nằm rải rác và lộn xộn, không có một vị trí hay qui luật nào. Tuy nhiên, bài toán tìm kiếm khó hơn bài toán nhặt đỗ đen rất nhiều. Muốn tìm tất cả các hạt đỗ đen, bạn đơn giản chỉ cần thiết kế một cái sàng hình cầu đủ lớn để có thể đổ cả thùng gạo vào đó, với những chiếc lỗ có kích thước phù hợp sao cho hạt gạo chui lọt còn hạt đỗ đen thì không, và quay đủ số vòng để tất cả các hạt gạo đều có cơ hội bay ra ngoài. Việc tìm kiếm thông tin trên Internet lại hoàn toàn khác. Có tới hàng chục tỉ trang Web tràn ngập trên mạng Internet (gấp nhiều lần số hạt gạo trong thùng), và vấn đề là làm sao đưa ra những gì ta muốn thu thập sao cho đồng thời thỏa mãn hai tiêu chí: Chính xác và nhanh chóng. Hơn thế nữa, người dùng cũng không đủ kiên nhẫn để ngồi duyệt qua tất cả các trang web chứa thông tin cần tìm (anh ta cũng không nhất thiết phải đếm từng hạt đỗ đen, tuy nhiên nếu xét trên tiêu chí dinh dưỡng thì đa phần những hạt đỗ đen đều giống nhau, do đó hạt nào cho vào nồi trước cũng không quan trọng). Trên thực tế, người dùng hiếm khi vào quá mười trang web kết quả, và vì thế, một yêu cầu khó khăn nữa cần giải quyết, đó là những gì phù hợp nhất phải được đặt lên hàng đầu. Trước đây, người ta thường chia dữ liệu cần lưu trữ làm nhiều mục, đến lượt các mục con này lại được chia nhỏ hơn. Người dùng tìm kiếm thông tin thông qua việc duyệt qua liên kết giữa các mục. Tuy nhiên, những chủ đề được nêu trong Internet đã rộng lớn đến nỗi sự phân chia này trở nên cực kì cồng kềnh và bất tiện. Ngày nay, hầu hết mọi người đều sử dụng Search Engine để tìm kiếm thông tin trên mạng Internet. Đối với mỗi Search Engine (Google, Yahoo, MSN, v.v…), người dùng truy vấn tìm kiếm (hay nói đơn giản hơn là nhập vào một số từ khóa liên quan đến chủ đề cần tìm), và nhận được một danh sách các trang kết quả (thông thường là những trang web chứa các từ khóa cần tìm kiếm), được sắp xếp theo một tiêu chí nào đó. Những tiêu chí này đều nhằm mục đích đưa ra kết quả phù hợp nhất với yêu cầu tìm kiếm. Tự xây dựng một Search Engine là một thách thức không nhỏ và rất đáng để xem xét. Tất nhiên sản phẩm của những sinh viên như chúng ta không có ý nghĩa gì khi so sánh với Google Search hay Yahoo! Search, và tất nhiên cũng mang rất ít giá trị về mặt thương mại cũng như thực tiễn (phải nói là không có thì đúng hơn). Nhưng đối với bản thân mỗi người học chúng ta thì giá trị học hỏi và kiến thức là rất to lớn, bởi như đã nói ở trên, những mảng đề tài liên quan đến Search Engine là rất nhiều. |
Thông tin tư vấn: |
Tại TP.Hồ Chí Minh |