گوگل چگونه کار میکند ؟
پیش از آنکه به شیوهی عملکرد گوگل بپردازیم، لازم است با کاری که گوگل انجام میدهد آشنا شویم.
گوگل چه کاری انجام میدهد؟
گوگل شامل سرویسهای مختلفی است که همگی با مرکز بودن سرویس جستجو، با یکدیگر در ارتباط هستند. برای مثال اطلاعاتی که در شبکهی اجتماعی گوگل پلاس به اشتراک گذاشته میشوند یا اطلاعات نقشه و خیابانهای سرتاسر دنیا به صورت فوری در جستجوگر گوگل قابل یافته شدن هستند.
هستهی مرکزی گوگل یا بخش جستجو، وظیفه دارد تمامی محتواهای متنی، تصویری و ویدئویی موجود در دنیای اینترنت را بررسی کند و نتایج مورد نیاز کاربران را بر اساس قدرت پاسخگویی و کیفیت مرتبسازی کند و به آنها نمایش دهد.
برآورد میشود بیش از یک میلیارد سایت اینترنتی و بیش از ۶۰ تریلیون صفحهی متفاوت در حال حاضر وجود دارند. همچنین تعداد جستجوهای انجام شده در هر ماه به بیش از ۱۰۰ میلیارد میرسد. بدیهی است که جستجوی این تعداد از صفحات که در هر دقیقه هزاران صفحهی جدید نیز به آن افزوده میشود، با تکیه بر ابزارهای جستجوی عادی امکانپذیر نیست.
بهترین شرحی که میتواند گویای وضعیت جستجو باشد، ضربالمثل یافتن سوزن در میان انبار کاه است.
گوگل چگونه کار میکند؟
جزئیات سیستم عملکرد گوگل به ویژه در بخش رتبهبندی نتایج جستجو، برای جلوگیری از سوء استفاده برای سئو سایت، به صورت محرمانه نگهداری میشوند ولی برخی شیوههای عملکرد آن به صورت رسمی یا توسط کارشناسان گوگل بیان شده است. به عنوان مثال صفحهی How Search Works بخشی از عملکرد گوگل را برای کاربران عادی به صورت تصویری شرح میدهد.
حجم اطلاعاتی که گوگل برای جستجوی صفحات وب روی سرورهای خود نگهداری میکند بیش از ۱۰۰ میلیون گیگابایت است.
نمایش نتایج مناسب عبارت جستجو شده توسط کاربران مراحل مختلفی دارد:
- نگهداری تمامی محتوای وب روی سرورهای گوگل( Index )
- تایپ عبارت توسط کاربر
- درک عبارت تایپ شده توسط گوگل
- جستجوی صفحات متناسب
- پاکسازی نتایج آلوده و هرزنامه
- مرتبسازی بر اساس معیارهای گوناگون
نگهداری اطلاعات روی سرورهای گوگل( Index )
گوگل با رفتن از صفحهای به صفحهی دیگر و بررسی پیوندهای موجود در این صفحات تلاش میکند تمامی صفحات موجود در هر سایت و تمامی سایتهای موجود در اینترنت را شناسایی کند. برای صفحات و سایتهایی که هیچ پیوندی به آنها وجود ندارد نیز بخشی برای معرفی سایت و سیستم نقشه سایت طراحی شده است. با توجه به حجم زیاد صفحات و سایتهای اینترنتی، جستجو و نگهداری سایتها توسط هزاران سرور گوگل به صورت همزمان به انجام میرسد. هر سرور به صورت برنامهریزی شده بخشی از صفحات وب را دریافت، پردازش و نگهداری میکند.
فرآیند جستجو
کاربران مختلف با مراجعه به سایت گوگل یا با سایر روشهای ممکن از جمله جستجوی صوتی و جستجو با استفاده از نرمافزارهای دیگر، عبارتهای خود را به گوگل ارسال میکنند. نخستین گام پس از دریافت شدن عبارت، تحلیل و بررسی عبارت است. برخی از عبارتهای جستجو شده تکراری هستند و بدون طی شدن مراحل بعدی میتوانند به صورت فوری پاسخگویی شوند. برخی دیگر از جستجوها که تازه هستند، میبایست با گذر کردن از چندین فیلتر از جمله «تعیین موضوع»، «رفع خطاهای تایپی»، «ترجمه به زبانهای دیگر»، «بررسی علاقمندیهای کاربر» و … موضوع و مفهوم قابل درکی برای سیستم پیدا کنند.
در گام بعدی این عبارت بسته به تصمیم هستهی مرکزی جستجو، ممکن است به صورت همزمان به صدها سرور ارسال شود تا این سرورها هر یک بخشی از اینترنت را برای عبارت مورد نظر جستجو کنند.
هر سرور پس از دریافت عبارت، اطلاعات موجود را برای یافتن عبارت مورد نظر جستجو میکند و به هر نتیجهی یافته شده بر اساس معیارهای محرمانه، امتیازی نسبت میدهد. هر چه امتیاز نسبت داده شده بیشتر باشد، احتمال پاسخگویی به پرسش کاربر بیشتر خواهد بود. در این مرحله تلاش میشود سایتهای مخرب، سایتهای هک شده، سایتهای هرزنامه و سایتهای بی کیفیت شناسایی و علامتگذاری شوند.
نتایج یافت شده در هر سرور، همگی به هستهی مرکزی جستجو ارسال میشوند و بر اساس امتیازهای تعیین شده، مرتبسازی میگردند. این نتایج سپس در قالب چندین صفحه نتیجهی جستجو به کاربر نمایش داده میشوند.
فرآیند مرتبسازی نتایج
یکی از پیچیدهترین بخشهای جستجو، مرتبسازی بر اساس کیفیت مطالب است. حجم بسیار بزرگی از مطالب موجود در اینترنت با هدف فریب موتور جستجو و با روشهای مختلف تولید میشوند. اگر این گونه سایتها موفق شوند موتور جستجو را فریب دهند و در رتبههای نخست قرار گیرند، بازدیدهای بیشتری دریافت میکنند و از این راه میتوانند به درآمد دست پیدا کنند. موتورهای جستجو و تولیدکنندگان هرزنامه به صورت مستمر در حال مبارزه هستند. مبارزه با هرزنامه به دو صورت خودکار و دستی به انجام میرسد. الگوریتمهای خودکار شناسایی هرزنامه به صورت پیوسته در حال بهبود هستند همچنین موارد بسیاری که با استفاده از الگوریتمهای گوگل قابل شناسایی نباشند به صورت دستی، از نتایج جستجو حذف میشوند.
علاوه بر هرزنامهها که مشکلی جدی در مرتبسازی بهینه به شمار میروند، یافتن مطالبی با کیفیت بهتر نیز به تنهایی کاری دشوار است. مطالب جدید با سرعتی زیاد به اینترنت افزوده میشوند و تشخیص مطالب بهتر که بتوانند پاسخی مناسبتر به کاربران ارائه کنند کاری بسیار پیچیده است.
کارشناسان گوگل پی در پی الگوریتمهای رتبهبندی را تغییر میدهند و نتایج به دست آمده را میآزمایند تا همیشه بهترین روشها و الگوریتمهای ممکن بهکارگیری شوند.
کمک به افزایش کیفیت نتایج جستجو
همان گونه که گفته شد، در اختیار داشتن نتایج با کیفیت نیازمند تلاش و تغییرات پی در پی است. همچنین لازم است تا کاربران با استفاده از بازخوردها و گزارشهای خود، وبسایتهای متقلب و مخرب را به گوگل گزارش دهند.
انواع سایتهایی که میتوانند در گوگل گزارش شوند عبارتند از: سایتهای سرقت کننده اطلاعات شخصی، سایتهای هک شده، سایتهای خریدار و فروشنده بکلینک، سایتهای ارسال کننده هرزنامه، سایتهای Cloaking یا محتوای دوگانه برای کاربر و موتور جستجو، سایتهای تولیدکننده محتوا با ربات و …
انواع گوناگون سایتهای متقلب و مخرب را میتوانید با مراجعه به این صفحه گزارش نمایید تا توسط گوگل مورد بررسی قرار گیرند. مشارکت همگانی در این کار سبب میشود کیفیت نتایج جستجو به ویژه نتایج فارسی روز به روز افزایش یابد. افزایش کیفیت نتایج علاوه بر مزایایی که به صورت مستقیم در پی دارد، سبب صرفهجویی در زمان و هزینهی میلیونها کاربر اینترنت خواهد شد.