این یعنی در ابتدا باید ربات های مورد نظر را فراخوانی کنید سپس به آنها دستور ایندکس کردن یا نکردن صفحات را بدهید. مثلا زمانی که قصد داریم برای یک صفحه از مقالات سایتمان، یک صفحه pdf و یک صفحه قابل پرینت هم ایجاد کنیم، باید صفحه اصلی را نگه داشته و مابقی را به کمک robots.txt پنهان کنیم. اگر وبسایت خود را به ابزار سرچ کنسول گوگل متصل کرده باشید، وقتی این ابزار تست را باز کنید از شما میخواهد که سایت متصل شده مورد نظر را انتخاب کنید.
- پس از وارد کردن قوانین برای ذخیره تنظیمات میبایست بر روی دکمه Save Changes کلیک کنید.
- بنابراین قبل از استفاده از این مورد به این مسئله دقت کافی را داشته باشید.
- دستور Disallow از پرکاربردترین دستورات در فایل robots.txt است.
- یکی از مواردی که متخصصین بایستی در نظر بگیرند بررسی چک لیست کلیک پذیری یکی…
- این رباتها صفحات وب را «خزش» میکنند و محتوای آن را فهرستبندی میکنند تا در نتایج موتورهای جستجو نمایش داده شوند.
- گاهی اوقات به جای فهرست کردن همه فایلها به صورت جداگانه، مسدود کردن چندین صفحه به طور همزمان کارآمدتر است.
یعنی روند اثرگذاری پروژه های سئوی شما هم کند هستش هم زمانبره هم انرژی بره هم هزینه بر. […] کاملاً واضح است که هر موتور جستجوی معقول و منطقی از داده های کلیک بر روی نتایج خود بهره می جوید تا از بازخورد آن برای بهبود رتبه بندی و کیفیت نتایج جستجو استفاده کند. نتایج کم کلیک باید در نتایج پایین تر قرار بگیرند زیرا کمتر با عبارات جستجو شده ارتباط دارند، و بدیهی است که نتایجی که مرتباً کلیک می شوند به سمت نتایج بالا صفحه می روند. در ادامه توجه شما را به نکاتی جلب می کنیم که رعایت آن ها در ساخت فایل robots.txt موجب سئو هر چه بهتر وب سایت شما خواهد شد. در این جا علامت های ریاضی همان پارامترهای جستجوی درون سایت هستند.
فایل robots.txt چه می کند؟
شاید بپرسید چرا باید اینکار را انجام داد؟ پاسخ این پرسش بسیار ساده است. من یک سایت تازه راه اندازی کرده ایم و نمیخواهم گوگل آن را ببیند. پس آن را از دسترسی گوگل و بینگ و هر موتور جستجوی دیگری خارج می کنم. اگر اولین بارتان باشد که این قسمت را باز میکنید و قبل از نصب افزونه یوست سئو فایل ربات خود را نساخته باشید، دکمه برای شما به صورت “ایجاد فایل ربات” نمایش داده خواهد شد. از آن جایی که فایل Robot.txt یک فایل متنی ساده است، ایجاد کردن آن کار دشواری نیست؛ برای انجام این کار نیاز به یک ویرایشگر متن ساده مانند Notepad دارید. در این ویرایشگر صفحه ای را باز کنید و یک برگه خالی را با نام robots.txt ذخیره کنید؛ سپس وارد cPanel شوید و بعد public_html را برای دسترسی به دایرکتوری روت سایت، باز کنید.
توجه داشته باشید که حتما از یک صفحهی 404 یا صفحات مشابه برای دایرکتوریهایی که قرار نیست ایندکس شوند اما وجود دارند استفاده کنید. اعمال تغییرات ناخواسته در این فایل میتواند کل سایت یا بخش بزرگی از سایت شما را از دسترس موتورهای جستجو خارج کند. با تنظیم صحیح این فایل میتوانید فرایند خزش در سایت خود را بهینه سازی کنید و از فهرست شدن صفحات با محتوای تکراری جلوگیری کنید. در برخی موارد بلاک کردن موتورهای جستجو از بررسی بخشهای مشکل دار سایت شما، مخصوصا در سایتهای که نیاز به پاکسازی سئویی گسترده دارند، میتواند مفید باشد. در نهایت پس از پیاده سازی اصلاحات سئویی میتوانید مجددا اجازه بررسی صفحات اصلاح شده را به ربات موتورهای جستجو بدهید.
Robots.txt هر سایت مختص همان سایت است و ممکن است برای سایت شما عملکرد مناسبی نداشته باشد و فرایند ایندکس شدن صفحات سایت را دچار اختلال کند. اگر بتوانید فایل robots.txt خوبی ایجاد کنید، میتوانید به موتورهای جستجو (به خصوص Googlebot) بگویید که کدام صفحات را مشاهده نکند. در واقع با این کار به رباتها میگویید کدام صفحهها اصلاً در اولویت شما نیستند. حتماً شما هم نمیخواهید که ربات خزنده گوگل برای مشاهده و ایندکس محتوای تکراری و کم ارزش، سرورهای شما را اشغال کند. گوگل دیگر کودکی نیست که فقط به محتوای html سایت شما دقت کند و آن را در حالی که شما از دیگر تکنولوژی هایی مثل جاوا اسکریپت و … استفاده می کنید نادیده بگیرد و تمامی محتواهای تمام صفحات شما را بیرون بکشد.
آیا تمامی رباتهای موجود در اینترنت از فایل txt پیروی میکنند؟
دستور Disallow به رباتها میگوید که چه فولدرهایی از وبسایت شما را نباید بررسی کنند. درواقع این دستور، بیانگر آدرسهایی است که میخواهید از رباتهای جستجو پنهان بماند. از نظر فنی می توانید فایل robots.txt خود را در هر دایرکتوری اصلی سایت خود قرار دهید. در صورتی که مشکل صفحه را حل نکنید و دستور دیس الو را هم اجرا نکنید، صفحه مورد نظر در گوگل ایندکس می شود و ممکن است به سئو سایت شما ضربه بزند. نردبان قصد دارد به شکلی حرفهای، جایگاه مشتری را در فضای وب دگرگون کند.
بنابراین اگر سایت شما است فایل robots.txt باید در آدرس example.com/robots.txt قابل دسترسی باشد. به عنوان مثال فایل robots.txt سایت گروه دیجیتال نردبان از اینجا قابل مشاهده است. گزارش سئو یکی از اصلیترین کارها و وظیفههایی است که باید هر شرکت خدماتی سئو به مشتریان خود ارائه دهد. درواقع در گزارش سئو شما میتوانید از روند فعالیتهای انجامگرفته و بازخوردهای آن اطلاعاتی به دست بیاورید و البته مهمترین کارها در بهینه سازی سایت است.
کاربرد robots.txt چیست؟
Crawl Stats وجود دارد که دفعات بررسی صفحههای سایت به صورت روزانه را نمایش میدهد. در همین صفحه، حجم دانلود شده توسط رباتها و همینطور زمان بارگذاری صفحهها را میتوانید ببینید. همه چیز درباره طراحی سایت ریسپانسیو آیا میدانید طراحی سایت ریسپانسیو چیست و چه کاربردی دارد؟ امروزه رقابت در میان سایتها و کسبوکارهای اینترنتی داغِ داغ است. کوکی مرورگر چیست و چرا اهمیت دارد؟ کوکیها، فایلهایی هستند که اطلاعات مفیدی را در کامپیوتر شما ذخیره میکنند.