بعضی از موتورهای جستجو تکنیکی به نام
Stemming را پشتیبانی میکنند که تکنیکی است که معمولا با اضافه کردن * یا گاهی ؟ به عبارت موردنظر از موتور جستجو درخواست میکند که به جای این علامت، مشتقات آن را جستجو کند.
به عنوان مثال جستجوی *moon نتایجی مثل moons, moonlight, moonshot را در برخواهد داشت.
گوگل از این ویژگی به طور صریح استفاده نمیکند. ولی زمانی که شما جای یک کلمه را در عبارتی نمیدانید، میتوانید از * استفاده کنید که از این ستاره به معنای جانشین یک کلمه کامل در گوگل، برداشت میشود. بنابراین طبق گفته های بالا جستجو برای “three * mice” موارد زیر را در نتایج خواهد داشت:
finds three blind mice, three blue mice, three green mice,
چقدر این ویژگی گوگل بدرد میخورد؛ مطمئنا به اندازه ویژگی stemming مفید نیست ولی بازهم موجب گیج شدن مبتدیان نمیشود. یک * یک جانشین برای یک کلمه است، دو * به معنای دو کلمه و …
این ویژگی در موارد زیر قابل استفاده است:
۱- فائق آمدن بر محدودیت ۱۰ کلمه گوگل ( در گوگل عبارتهایی که بین دو کوتیشن قرار میگیرد، نباید بیش از ۱۰ کلمه باشد) شما این مثالها را (مثلا عبارت Fourscore and seven years ago, our fathers brought forth on this continent) که زیاد برای پیدا کردن یک شعر یا نقل قول تکرار میشوند را، اگر امتحان کنید، گوگل تنها تا کلمه on عمل جستجو را انجام خواهد داد و همه آنچه بعد از آن میآید، توسط گوگل نادیده گرفته میشود.
۲- بررسی تکرار یک عبارت معین یا مشتق عبارت مثل: (درباره دستور اینتایتل بعدا توضیح داده خواهد شد)
intitle:”methinks the * doth protest too much”
و یا
intitle: “the * of Seville”
3- پر کردن جاهای خالی حافظه یک آدمحواسپرت! شاید شما فقط یک قسمت کوتاه یک ترانه را به یاد بیاورید که جستجو تنها از آنچه شما به یا میآورید، به جای بازسازی تصادفی استفاده میکند.
بیایید یک مثالی را مرور کنیم، سرود “Good Times” که توسط چیک سروده شده است، که خط زیر را بیان میکند:
“You silly fool, you can’t change your fate.”
شاید شما یک ترانه را گوش کردهاید، اما شما یادتان نمی اید که کلمه fool درست است یا چیز دیگری بوده، اگر شما اشتباه کرده باشید ( اگر درستش به عنوان مثال “You silly child, you can’t change your fate” باشد) شما هیچ جوابی نخواهید یافت.
راه حل استفاده از ویژگی گوگل است که به جای آن کلمه سرچ کنیم:
“You silly *, you can’t change your fate”
شما این تکنیک را میتوانید برای نقلقولها و شعرهای غنایی و … به کار ببرید، شما باید حواستان را جمع کنید که به اندازه کافی از متن نقلقول را سرچ کنید تا به یک نتیجه واحد برسید. مثلا عبارت زیر که قسمتی از مثال بالاست نتایج زیادی در بر خواهد داشت:
“you * fool”
دستورات و المانهای خاص:
علاوه بر OR و AND و جستجوهای عبارتی، Google دستورهای خاص زیادی را برای
محدود نمودن جستجوی شما فراهم نموده است.
همانند همه موتورهای جستجوی Full Text، در گوگل به جای اینکه صفحات وب تنها بر اساس عنوان و توضیحات انها ایندکس شوند، صفحات وب کلا ایندکس میگردند. دستورهای خاص به کاربران گوگل اجازه میدهند که جاهای معینی از صفحات وب را برای اطلاعات به خصوصی، جستجو
نمایند، و این اجازه را به کاربران گوگل میدهند که بتوانند جاهای معینی از صفحات وب را برای اطلاعات به خصوصی، جستجو نمایند (که آنها اپراتورهای پیشرفته نیز نامیده میشوند). این ویژگی (دستورات و المانهای خاص) خیلی چارهساز است مخصوصا زمانی که شما با بیش از ۸ بیلیون صفحه وب مواجهید و میخواهید دامنه جستجوی خود را محدودتر نمایید!
مثلا ذکر اینکه اینکه کلمات عبارت مورد نظر شما تنها بایستی در عنوان یا URL صفحات وب باشد، میتواند کمک شایانی به شما برای به دست
اوردن نتایج بسیار خاص داشته باشد. در ادامه مطلب به شرح برخی از المانهای دستوری معمول خواهیم پرداخت:
intitle:
این المان جستجوی شما را به عنوان صفحات وب محدود میکند و متغیر :allintitle صفحاتی که عنوانشان تمام کلمات ذکر شده جستجو را دربردارد را پیدا میکند و هر دو دستور، قبل کیوردها استفاده میشوند.
intitle:”windows xp”
allintitle:”windows xp” microsoft
همچنین ممکن است شما ترجیح دهید از دستور :allintitle استفاده نکنید، چون در ترکیب با دستورات دیگر ممکن است خوب کار نکند.
site:
این دستور به کاربر اجازه میدهد که جستجوی خود را به یک سایت محدود نماید.
site:loc.gov
site:thomas.loc.gov
site:edu
site:nc.us
نکته ای که تذکرش لازم است این است که این دستور، دستور خوبی برای یک وبسایتی که شامل زیرشاخههایی (مثل /~sam/album/ ) است، نمیباشد. مثلا شما نمیتوانید با دستور :site همه صفحات را در http://www.geocities.com/test/test1/6485 بیابید و گوگل هیچ نتیجهای برای جستجوی شما نخواهد یافت. به جای این دستور، دستور :inurl پیشنهاد میشود.
inurl:
این دستور جستجوی شما را به URL صفحات وب محدود میکند. این دستور برای یافتن صفحات help بسیار خوب کار میکند، زیرا آنها نسبتا در
ساختار خود منظماند و :allinurl متغیری است که همه کلمات لیست شده در URL را پیدا میکند ولی در ترکیب با دستورت دیگر خوب کار نمیکند.
inurl:help
allinurl:search help
همانطور که میبینید استفاده :inurl به جای :site یک مزیت ضروری دارد و آن اینست که شما میتوانید از آن برای جستجوی سابدایرکتوریها (زیرفهرستها) نیز استفاده نمایید.
تذکر: در استفاده از دستور :inurl برای داشتن نتایج بیشتر از //:http استفاده نکنید.
همچنین شما میتوانید :inurl را در ترکیب با :site به کار برید تا بتوانید اطلاعات سابدامینها (زیردامنهها) را استخراج نمایید. برای مثال opensource.org چند تا سابدامین دارد؟ یک جستار سریع به شما کمک میکند تا به پاسخ این جواب برسید:
site:opensource.org -inurl:www.opensource.org
این جستجو از گوگل میخواهد تا تمام صفحات دامنه opensource.org را لیست کند، اما صفحاتی را که از زیر دامنه معمول www هستند و شما آنها را قبلا دیده بودید، نادیده بگیرید.
link:
این دستور فهرستی از صفحاتی که به URL تعیین شده لینک دادهاند را، مییابد. اگر :link را وارد کنید شما به فهرستی از صفحاتی که به
صفحه گوگل لینک دادهاند، دست مییابد ( نه در هر جای دامنه google.com ) نگران نباشید اگر ادرس شما با //:http همراه نباشد، شما
به آن نیازی ندارید. بنابراین اگر ادرس شما //:http هم داشت، باز گوگل آنرا نادیده میگیرد. این دستور به خوبی با هر URL با محتوای بزرگ کار
میکند. مثلا سرعت جستجویش در http://www.opensource.org/test/test1 فرقی با بالاترین مرتبه سایت، مثل opensource.org ندارد.
cache:
این دستور یک کپی از صفحهای که در گوگل ایندکس گذاری شده است را، مییابد. حتی اگر آن صفحه دیگر در URL اصلی در دسترس نباشد یا
محتوایش به کلی تغییر کرده باشد.
cache:www.yahoo.com
catch گوگل مخصوصا برای باز یافتن نگارش قبلی یک صفحه که بارها تغییر میکند، مناسب است.
daterange:
این دستور جستجوی شما را به تاریخ به خصوصی یا یک محدوده تاریخی که صفحه در گوگل ایندکس گذاری شده، محدود مینماید. باید در نظر داشت که این جستجو، کاری به تاریخی که یک صفحه ساخته شده است، ندارد و تنها بر مبنای تاریخ ایندکس گذاری در گوگل، عمل میکند.
“Microsoft” “Windows XP” daterange:2450958-2450968
پایان
برچسب :