Sitemap یا نقشه سایت یک فایل عمدتا XML است، وظیفه راهنمایی و هدایت رباتهای موتورهای جستجو برای خزش بهتر محتوای سایتها را بر عهده دارد. میتوانیم به کمک فایل robots.txt مشخص کنیم که آدرس این فایل دقیقا کجاست و موتورهای جستجو از کجا باید آدرس نقشه سایت ما را پیدا کنند. فایل Robots.txt یک فایل متنی است که مدیران وبسایتها برای آموزش به رباتهای موتورهای جستجو ایجاد میکنند.
- وارد هاست خود که شدید روی File Manger کلیک کرده و وارد پوشه Public_html شوید.
- پس رباتها نه تنها ضرری برای سایت شما ندارند، بلکه باید خیلی هم از آنها استقبال کرد.
- در مرحله دوم، بعد از اینکه مشخص کردیم دقیقا با چه رباتی طرف هستیم، حالا باید مشخص کنیم که محدودیتهای این ربات چیست و چه صفحات و منابعی از وبسایت شما را نباید بررسی کند.
- جلوگیری از ایندکس کردن فایلهای خاص در وبسایت شما (تصاویر، PDF و غیره) توسط موتورهای جستجو.
در ادامه مقاله با ساخت فایل robots.txt بیشتر آشنا خواهید شد. امروزه با رشد روز افزون کسب و کارهای اینترنتی رقابت سختی میان وبسایتها درگرفته است و مدیران سایتها همواره در تلاشند تا سایت خود را جزو نتایج اولیه در گوگل نمایش دهند. متدها و راهکارهای بسیاری در این زمینه وجود دارند که یکی از این موارد با کمک بهینه سازی فایل Robot.txt انجام میشود. امیدواریم مطالعه این مقاله گامی مثبت در راستای بهینهسازی سایت شما باشد. شما میتوانید سوالات و نظرات خود را از بخش دیدگاهها با ما مطرح کنید؛ همچنین اگر محتوای امروز همیار وردپرس برایتان مفید بود، خوشحال میشویم آن را با دوستان خود در شبکههای اجتماعی به اشتراک بگذارید.
همچنین، اگر هزاران صفحه دارید که می خواهید آنها را مسدود کنید، گاهی اوقات راحت تر می توانید کل قسمت آن سایت را با robots.txt مسدود کنید، به جای اینکه به طور جداگانه یک تگ noindex به هر صفحه اضافه کنید. این راهنمای مفید از Google اطلاعات بیشتری در مورد قوانینی که می توانید برای مسدود کردن یا اجازه ربات ها به خزیدن صفحات مختلف سایت شما استفاده کنید. در اینجا ما به ربات های گوگل می گوییم که در وب سایت ما در تمام فولدرهای مربوط به تصاویر خزش نکنند. با مسدود کردن صفحات غیر ضروری ربات های گوگل زمان لازم را برای خزش در صفحات مهم به دست می آورند و می توانند آنها را فهرست بندی کنند.
مثلا اگر شما در صفه ای از سایتتون روزانه یک سرچ هم نداشتین یک دفعه اون از رو صفر به ده یا بیست تا نرسونین. اول با روزی سه الی چهارتا سرچ شروع بکنید و بعد از دو روز بکنیدش هفت تا یا هشت تا حالا همینطور خورد خورد تعدادش رو افزایش بدین تا گوگل شک نکنه. در نهایت همینطور که سئو سایتتون رشد میکنه کلمات کلیدی بهتر و قوی تری مد نظر قرار بدین و تعداد جست و جو های روزانه رو بیشتر بکنید. یکی دیگر روشهای ویرایش فایل robots.txt به صورت دستی میباشد که میتوانید از طریق سی پنل هاست و یا FTP به هاست خود متصل شده و فایل را ویرایش و سفارشیسازی کنید. پس از ورود به هاست، می توانید فایل robots.txt را در پوشه اصلی وب سایت خود یا public_html پیدا کنید.
در استفاده از Nofollow و Disallow به طور همزمان مراقب باشید.
در اوایل مقاله با انواع رباتها و خزندههای سطح وب آشنا شدیم، حتی به صورت دقیقتر اسامی و وظیفه مهمترین رباتهای گوگل را هم بررسی کردیم. حالا به کمک دستور User-agent میتوانیم مشخص کنیم که دستورات ما دقیقا توسط چه رباتی باید اجرا شوند. همانطور که گفتیم فایل ربات سایت یک استاندارد همگانی برای مشخص کردن محدودیتهای خزیدن رباتهای مختلف در سطح وب است، بنابراین انتظار میرود که از دستورات استاندارد و همگانی هم برای این فایل استفاده کنیم. شرکتهای مختلف با اهداف متفاوتی اقدام به ساخت و استفاده از این رباتها میکنند.
پروتکل نقشه سایت در robots.txt
بعد از خواندن این مقاله میتوانید هر نوع رباتی را فقط با دانستن نامش محدود و کنترل کنید. خوشبختانه دسترسی رباتها به صفحهها یا فایلها را میتوانیم کنترل کنیم. آشنایی کامل با کپچا و کاربردهای آن کپچا چیست و چه کاربردی دارد؟ کپچا به زبان ساده یک ابزار آزمایشگر است که با کمک آن میتوان رباتها را از انسانها تشخیص داد. آموزش گام به گام ساخت ایمیل در گوشی یا کامپیوتر برای ثبت نام در شبکههای اجتماعی، سایتهای معتبر و انجام بسیاری از کارهای الکترونیکی از شما یک پست الکترونیک یا همان ایمیل درخواست… مهمترین و اثرگذارترین روشهای تبلیغات اینترنتی برای کسبوکارها دنیای امروز به دنیای تکنولوژی معروف است؛ جهانی که سرعت در آن حرف اول را میزند و فناوری روزبهروز پیشرفتهای بیشماری میکند.
بنابراین برای تهیه یک فایل robots.txt مناسب و عالی ما نیز باید با این دستورات و نحوه تفسیر آنها توسط رباتها آشنا باشیم. مهمتر از همه اینکه رباتهای گوگل به خوبی با این استاندارد آشنا هستند و از دستورات آن هم پیروی میکنند. گوگل که به خوبی از این موضوع آگاه است، برای اینکه به تجربه کاربری سایتها کمترین لطمه را وارد کند برای هر سایت یک بودجه خزش مشخص در نظر میگیرد و با توجه به فاکتورهای مختلفی این بودجه را کم یا زیاد میکند. فایل Robots.txt دسترسی خزندهها به بخشهای مختلف سایت شما را کنترل میکنند. درنتیجه اگر شما به صورت تصادفی Googlebot را از خزیدن در سایت خود منع کنید ممکن است برای سئو و رتبه بندی سایت شما خیلی خطرناک باشد. از آنجایی که منبع محدودی از خزیدن دارید، میتوانید robots.txt را نصب کنید تا از صفحات اضافی از طریق Googlebot جلوگیری کرده و آنها را به موارد مهم معرفی کنید.
اگر از افزونه یوآست در سئوی وب سایت وردپرسی خود استفاده می کنید، پیشنهاد می کنیم به نوشته نحوه افزودن کلمه کلیدی و توضیحات متا در وردپرس نیز نگاهی بیاندازید. کلیه سایتها برای ایندکس شدن توسط موتورهای جستجوی به فایل robots.txt نیاز دارند. اگر سایت وردپرسی شما دارای فایل robots.txt نباشد، موتورهای جستجو تمام وبسایت شما را پیمایش و فهرست میکنند که در این صورت نمیتوانید به موتورهای جستجو دستور دهید که نباید کدام صفحات و فایلها را پیمایش کنند. در واقع فایل Robots.txt یک قرارداد بین سایت شما و رباتهای خزنده است که به آنها اعلام میکند چه محتوایی قابل بررسی و چه محتوایی غیرقابل بررسی است.
آژانس دیجیتال مارکتینگ و طراحی سایت eBgroup از دهه 90 بعنوان یکی از آژانسهای موفق در زمینه سئو، طراحی سایت، تولید محتوا و تبلیغات کلیکی در غرب تهران مشغول به فعالیت بوده است. فایل robots.txt باید یک فایل متنی کدگذاری شده UTF-8 باشد (که شامل ASCII است). گوگل ممکن است کدهایی را که بخشی از محدوده UTF-8 نیستند نادیده بگیرد و قوانین robots.txt را نامعتبر کند. اگر گوگل عمل رباتیک را جریمه کند خیلی از افراد میتوانند بر روی سایت رقیب خود حرکات رباتیک پیادهسازی کنند و آنها را به زیر بکشانند!
برای اجازه دادن به خزش توسط ربات مورد نظر از دستور Allow و برای جلوگیری از خزش از دستور Disallow استفاده می شود. شما میتوانید با استفاده از چندین دستورالعمل به URLهای خاصی اجازه فعالیت دهید یا آنها را ممنوع و مسدود کنید، همچنین امکان افزودن چند نقشه به سایت را برای شما فراهم میکند. بهتر است دقیق تر با دستورات آشنا شوید و همیشه نظر یک متخصص را بپرسید تا بتوانید یک نقشه سایت درست حسابی برای خود بسازید.