گوگل اخیرا اعلام کرد که برای درک بهتر مفاهیم از یک الگوریتم تطبیق عصبی استفاده میکند. آقای دنی سالیوان از گوگل بیان کرد که این موتور جستجو در 30% جستجوها از این الگوریتم بهره میبرد.
گوگل اخیرا مقاله تحقیقاتی را منتشر کرده که در آن نتایج جستجو تنها بر اساس تطبیق عبارت مورد جستجو و محتوای صفحه انتخاب شده اند و عامل دیگری در میان نبوده است. با این که سیستم مورد استفاده در این تحقیق شاید هنوز به صورت عملی مورد استفاده قرار نگرفته یا اینکه جزیی از چند الگوریتم دیگر باشد، با این وجود میتواند مثالی برای نحوه کار الگوریتم تطبیق عصبی گوگل محسوب گردد.
آیا گوگل از الگوریتم های منتشر شده استفاده میکند؟
گوگل همیشه از الگوریتم های منتشر شده در پتنت ها و مقالات رسمی استفاده نمیکند. اما با این وجود مطمئنا تعداد نامشخصی از الگوریتم های منتشر شده، در الگوریتم جستجوی گوگل مورد استفاده قرار میگیرند.
همچنین گوگل در حالت کلی نیز به تایید یا تکذیب وجود یک الگوریتم در سیستم رتبه بندی خود نمیپردازد.
گوگل در مورد الگوریتم هوش مصنوعی جدید خود توضیحاتی داده است
گوگل در گذشته به بحث های کلی درباره الگوریتم های خود مانند پاندا و پنگوئن پرداخته است. دنی سالیوان نیز در روزهای گذشته نشانه هایی از وجود الگوریتم تطبیق عصبی مطرح کرده است. این الگوریتم توسط او در حساب توییتریش بدین شکل توصیف شد:
"تطبیق عصبی، روش برگرفته از هوش مصنوعی برای ارتباط بهتر کلمات با مفاهیم است."
او همچنین در توییتر خود نوشت:
"روشی که کاربران به جستجوی اطلاعات مورد نظر خود میپردازند با نحوه نوشتن راه حل متناسب با مشکلات کاربران توسط صاحبین وب سایت ها، اغلب متفاوت است."
به عنوان مثال او با توییت کردن تصویر زیر نشان داد که عبارت Change می تواند توسط کاربران معنی های متفاوتی داشته باشد:
هوش مصنوعی، یادگیری ماشینی و صفحات رتبه بندی
گوگل اخیرا در وبلاگ تخصصی هوش مصنوعی خود لینک به مقاله ای داده که در آن، صفحات رتبه بندی بر اساس میزان ارتباط کلمه مورد جستجو و محتوای صفحات، ایجاد شده بودند. اگرچه این الگوریتم رتبه بندی کاملا جدید است، اما نشان از بهبود زیادی در تشخیص میزان ارتباط محتوا با کلمات مورد جستجو توسط روش های شبکه عصبی دارد.
با این که به صورت قطعی نمیتوان گفت که موضوع مورد بحث در این مقاله همان الگوریتم تطبیق عصبی گوگل است، اما به نظر میسد که شباهت های زیادی بین آنها وجود دارد.
الگوریتم مورد بحث در مقاله مورد نظر بدین شکل توصیف شده است:
"رتبه بندی بر اساس محتوای صفحات که با عنوان ad-hoc retrieval نیز شناخته میشود، به سیستمی گفته میشود که صفحات تنها بر اساس متن های به کار رفته در آنها، رتبه بندی میگردند."
تحقیقات منتشر شده در این مقاله صراحتا اعلام میکند که این نوع سیستم رتبه بندی تنها متکی بر عبارت مورد جستجو و محتوای صفحت است.
در بیانیه مطرح شده در این مقاله اعلام شده که این سیستم کاملا متفاوت از سیستم های سنتیست که در آنها، رتبه بندی وب سایت ها علاوه بر اطلاعات ارائه شده در صفحه، به پیج رنک و لینک های آن نیز وابسته است.
آنچه که به وضوح دیده میشود اینست که سیستم رتبه بندی بر اساس محتوا، تقریبا یک سیستم جدید است که وابسته به لینک ها نیست.
آیا سیستم جدید رتبه بندی گوگل از لینک ها استفاده نمیکند؟
الگوریتم جدید منتشر شده در وبلاگ هوش مصنوعی گوگل به صورت مستقیم از فاکتورهای سنتی رتبه بندی استفاده نمیکند. با این حال ابتدا از فاکتورهای سنتی رتبه بندی استفاده شده و سپس بعد از آن بخش Ad-hoc retrieval گوگل به کار گرفته میشود.
مقاله مورد بحث اعلام میکند که این سیستم به رتبه بندی مجدد صفحات رتبه بندی شده میپردازد و فاکتورهای رتبه بندی سنتی به هیچ وجه ده آیتم اول نتایج جستجو را تعیین نمیکنند.
بنابراین میتوان گفت که فاکتورهای رتبه بندی سنتی عملکرد ارزیابی اولیه را انجام میدهند، سپس سیستم رتبه بندی جدید به حذف اسپم ها پرداخته و مرتبط ترین صفحات را جمع آوری میکند.
کاری که الگوریتم جدید انجام میدهد در واقع رتبه بندی مجدد صفحاتیست که بر اساس مجموعه متفاوتی از معیارها جمع آوری شده اند.
الگوریتم جدید چه کاری انجام میدهد؟
هدف الگوریتم جدید مرتبط کردن عبارت مورد جستجو با صفحاتیست که تنها به واسطه ارتباط بین عبارت مورد نظر و محتوای صفحات جمع آوری شده اند. وب سایت هایی که بر این اساس به موقعیت های بالای نتایج جستجو میرسند، دیگر به واسطه لینک ها یا کلمات کلیدی در این جایگاه ها قرار ندارند.
اهمیت محتوا بیش از پیش میگردد
آیا این مسئله بدین معنیست که تولید کنندگان محتوا بایست از عبارات مترادف بیشتری در محتوا استفاده کنند؟ استفاده از این تکنیک تنها در حالت استفاده خیلی کم، کارامد است و در صورت استفاده زیاد نشان از اسپم است. خیلی ساده لوحانه است که بپذیریم گوگل تنها به واسطه وجود مترادف های بیشتر در محتوا، رتبه بهتری به آن بدهد.
هدف از به کار بردن عبارت مترادف، درک بهتر محتوا توسط گوگل است. به نظر ما بیان واضح مفاهیم بسیار مهم تر از استفاده بی رویه از این گونه عبارت مشابه در دل محتواست.
چیزی که گوگل در بیانیه خود اعلام کرده توانایی درک مفاهیم است. این مسئله چیزی فراتر از کلمات کلیدی و عبارت مشابه است. در واقع این سیستم به درک طبیعی تر محتوای یک صفحه در رابطه با حل مشکلات کاربران به واسطه عبارت مورد جستجوی آنها میپردازد.
بستن *نام و نام خانوادگی * پست الکترونیک * متن پیام |