BERT là thuật toán mới nhất của Google cập nhật vào tháng 10/2019, thuật toán hướng đến việc hiểu rõ hơn ngôn ngữ tự nhiên của người tìm kiếm để đưa ra kết quả. Đây là thay đổi lớn nhất trong công cụ tìm kiếm lớn nhất thế giới này kể từ khi Google phát hành RankBrain.
Google đang thực hiện thay đổi lớn nhất đối với hệ thống tìm kiếm của mình kể từ khi công ty giới thiệu RankBrain.
*RankBrain: sử dụng trí thông minh nhân tạo để nhúng một lượng lớn ngôn ngữ viết vào các thực thể toán học – được gọi là vectơ – mà máy tính có thể hiểu được. Nếu RankBrain thấy một từ hoặc một cụm từ mà nó không quen thuộc, máy có thể đoán xem từ hoặc cụm từ nào đó có ý nghĩa tương tự và lọc kết quả tương ứng, giúp xử lý các truy vấn tìm kiếm mới, truy vấn chưa từng thấy trước đây một cách hiệu quả hơn
BERT là gì?
BERT được viết tắt của Bidirectional Encoder Representations from Transformers. Đây là kỹ thuật dựa trên mạng lưới của Google để phân tích và đào tạo công cụ tìm kiếm trước những ngôn ngữ tự nhiên. Đại khái nó có thể giúp máy tính hiểu ngôn ngữ giống như con người hơn một (nhiều) chút.
BERT bắt đầu tung ra trong tuần này và đang được triển khai cho các truy vấn ngôn ngữ tiếng Anh. Các ngôn ngữ khác sẽ được áp dụng trong tương lai.
Mời các bạn xem một số ví dụ để hiểu rõ hơn về thuật toán BERT
*Lưu ý: Các ví dụ dưới đây là dành cho mục đích minh họa và có thể không hoạt động trong kết quả tìm kiếm trực tiếp.
Ví dụ đoạn trích nổi bật. Dưới đây là một ví dụ về Google hiển thị đoạn trích đặc trưng phù hợp hơn cho truy vấn Bãi đậu xe trên một ngọn đồi không có lề đường.
Trước đây, một truy vấn như thế này sẽ gây nhầm lẫn cho các hệ thống của Google. Google cho biết, chúng tôi đã đặt quá nhiều tầm quan trọng vào từ “lề đường” và bỏ qua từ “không”, không hiểu từ đó quan trọng đến mức nào khi trả lời câu hỏi này. Vì vậy, chúng tôi sẽ trả lại kết quả cho việc đỗ xe trên một ngọn đồi với lề đường.
Một ví dụ về việc áp dụng thuật toán BERT
Trong một ví dụ khác, Google cho biết, với một tìm kiếm cho khách du lịch Brazil đến Mỹ cần thị thực 2019, thì từng từ và mối quan hệ của nó với các từ khác trong truy vấn rất quan trọng để hiểu ý nghĩa. Trước đây, Google sẽ không hiểu tầm quan trọng của kết nối này và sẽ trả về kết quả về việc công dân Hoa Kỳ đến Brazil. Còn với thuật toán mới – BERT, Tìm kiếm có thể nắm bắt được sắc thái này và biết rằng từ nào quan trọng ở đây và có thể cung cấp một kết quả phù hợp hơn nhiều cho truy vấn này.
Một ví dụ về việc áp dụng thuật toán BERT
Những điều cần quan tâm với thuật toán mới – BERT
RankBrain không chết. RankBrain là phương pháp trí tuệ nhân tạo đầu tiên của Google để hiểu các truy vấn trong năm 2015. Nó xem xét cả truy vấn và nội dung của các trang web trong chỉ mục của Google để hiểu rõ hơn ý nghĩa của các từ đó là gì.
BERT không thay thế RankBrain, đây là một phương pháp bổ sung để hiểu nội dung và truy vấn. Đó là phụ gia cho hệ thống xếp hạng của Google. RankBrain có thể và vẫn sẽ được sử dụng cho một số truy vấn. Nhưng khi Google nghĩ rằng một truy vấn có thể được hiểu rõ hơn với sự trợ giúp của BERT, Google sẽ sử dụng điều đó. Trong thực tế, một truy vấn có thể sử dụng nhiều phương thức, bao gồm BERT, để hiểu truy vấn.
Bạn có thể tối ưu hóa cho BERT không? Không chắc. Nhưng khẳng định là Google đang trở nên tốt hơn trong việc hiểu ngôn ngữ tự nhiên. Chỉ cần viết nội dung cho người dùng, như các bạn luôn làm. Đây là nỗ lực của Google để hiểu rõ hơn truy vấn của người tìm kiếm và kết hợp nó tốt hơn với kết quả phù hợp hơn. Nội dung có ích thực sự – sẽ có hiệu quả thực sự.
Tại sao chúng ta nên quan tâm. Chúng ta quan tâm không chỉ bởi vì Google cho biết sự thay đổi này là quy mô cho bước nhảy vọt lớn nhất trong năm năm qua và là một trong những bước nhảy vọt lớn nhất trong lịch sử Tìm kiếm.
10% của tất cả các truy vấn đã bị ảnh hưởng bởi bản cập nhật này. Đó là một thay đổi lớn!
Tôi khuyên bạn nên kiểm tra xem những thay đổi lưu lượng tìm kiếm của mình vào tuần tới và xem trang web của bạn đã bị ảnh hưởng bởi thay đổi này đến mức nào. Nếu đúng như vậy, hãy đi sâu hơn vào trang đích nào bị ảnh hưởng và truy vấn nào.