יום רביעי, 9 באפריל 2014

מי יודע למצוא מידע באינטרנט?

חלק מהעניין של ניהול ידע הוא איתור המידע, ולכן אני הולך להראות לכם דברים שלא ידעתם על מנועי חיפוש ואיתור מידע באינטרנט בכלל. תוכלו להתחיל ליישם את הדברים מיד אחרי שתסיימו לקרוא, בעיקר בשביל עצמכם, כי אני הולך לתת לכם, בנוסף לגישה בסיסית לחיפוש, טיפים למציאת מידע באינטרנט 
כמו טריקים בגוגל, השגת מידע על מוצרים, חברות ועל "הרשת הנסתרת".

למה מחפשים דווקא באינטרנט? כי יש המון מידע זמין ונגיש שיכול לעזור בדיוק במידע ובידע שאנחנו צריכים. אבל איך מתמודדים עם הכמות העצומה? זה כמו לשתות מברז שריפה...
איפה אתם מחפשים באינטרנט? שאלה רטורית, אני מניח, כי מי לא מחפש בגוגל??
אז חיפשתם ומצאתם 3 מיליון תשובות ולא הצלחתם למצוא מה שבדיוק רציתם.
איך נקבל תשובה מלאה? ומה אנחנו רוצים בעצם?
  • רוצים לחפש בכל המקורות באינטרנט
  • רוצים תוצאות בצורה מדורגת לפי רמת העניין שלנו
  • רוצים איכות על כמות
ניתן לומר בהרבה מקרים, שקיימת חשיבות גדולה לאסטרטגיות החיפוש יותר מאשר למערכת אחזור המידע

אסטרטגיית חיפוש יעילה מבוססת על כמה שיותר אפשרויות וצירופים של ביטויים, מילים ושילוב ביטויים נרדפים הקשורים במישרין או בעקיפין לנושא. יש לדבר הזה חשיבות גבוהה, כי בחירה של מילות מפתח "טובות" היא חיונית לחיפוש שמניב תוצאות טובות.

בחירת מילים לחיפוש
דוגמה: צינור מים, water pipe, יש מלא מילים נרדפות לצינור מים באנגלית -->
conduit, hookah, sluice, plumbing ועוד...
אז איך אתם יכולים להשתמש בזה? האתר תזאורוס יעזור לכם למצוא לא רק את המילים הנרדפות, אלא גם מילים בעלות משמעות דומה / קרובה.

טריקים בגוגל
בחיפוש בגוגל ניתן לבצע סינון מהיר - לפי web, תמונות, סרטונים, חדשות, ספרים ועוד.
סינון לפי זמנים, גודל, צבע, זכויות שימוש... 
בתפריט של גוגל כבר ניתן לסנן עפ"י קריטריונים כאלה.
להלן מספר טריקים: 
1. קיצורים - נניח שאנחנו רוצים לחפש מאמרים שפורסמו בניו יורק טיימס על מבחנים לא באוניברסיטה מסוימת על מבחני SAT ובשנים מסוימות. נכתוב בשורת החיפוש:
site: nytimes.com~college"test scores"
  • site:    רק באתרים מסוימים
  • " "       צירוף תוצאות של המילים שיבואו ביחד
  • ~         גוגל תחפש גם מילים קרובות (ללא רווח לפני המילה)
  • :          תחום זמן (ללא רווח לפני המילה)
2. נניח רוצים לחפש דו"ח על מהירויות אוויר שונות של סנוניות נפוצות. לא לשאול שאלות - לכתוב מה רוצים.
filetype: pdf air speed intitle: velocity
  • filetype:     איזה סוג קובץ אנחנו רוצים
  • intitle:        רק לפי מה שנמצא בכותרת
3. יש ריכוז של כל הטריקים - אתר אימונים אישיים בגוגל, כל הטיפים והטריקים מרוכזים כאן.

קיימים שני סוגים של מנועי חיפוש:
1. מנוע חיפוש המפעיל זחלן "crawler" שמאנדקס את דפי האינטרנט.
           לפי אלגוריתם ייחודי למנוע מביאים את התוצאות.
2. מנועי חיפוש "משלבים" המחפשים בתוצאות מנועי חיפוש אחרים ומשלבים (לדוגמה dogpile).
ולענייננו... 
מה זה אומר הרשת הנסתרת? סיכמנו שהאדם הממוצע מכיר את גוגל ומשתמש בו, אבל אולי לא ידעתם - גוגל לא מאתרת את כל האתרים והדפים ברשת האינטרנט. יש מנועי חיפוש שמומחים בתחום מסוים והם באותו תחום יותר טובים מגוגל. נניח שאתם צריכים מצגת בנושא מסוים - לצורך לימודים, הדרכה או פשוט בשביל עצמכם - אפשר לכתוב במנוע חיפוש filetype: ppt אבל גוגל לא בהכרח המנוע הטוב ביותר לחיפוש מצגות. יש אתרים שמתמקדים במצגות. סטודנטים רוצים עבור אוניברסיטאות. גוגל לא ממש "מאנדקס" אותם. האתר הבא נותן פתרון טוב לכך:
http://www.slidefinder.net/ - תוצאות אוניברסיטאיות
http://www.slideshare.net/ - אתר נוסף לחיפוש מצגות 
הנה כמה דוגמאות נוספות:
מנועי תשובות
SERP - search Engine Result Page - דף התוצאות של החיפוש.
אם נרצה לדעת מה גילו שמעון פרס? בחיפוש בגוגל נקבל בויקיפדיה - גיל (90) + תאריך לידה לחישוב.
wolfrom alpha - מצא תוצאת חישוב - 90 שנים ו-7 חודשים - יותר מדויק.
אם נרשום what is a green car? באתר ask הוא ימצא מה ההגדרה (לא אוטו ירוק).

מודיעין תחרותי - CI - competitive Intelligence
רוצים להסתכל על מוכרים או מפיצים ועל מוצרים ספציפיים. אז מה יש לנו כאן?
  • Google alerts = התראות גוגל. רוצים שיגיד לבד מתי תוצאות החיפוש השתנו, כלומר התראות אוטומטיות שיישלחו אלינו באימייל על שינויים. 
  • Google trends - עוסק בסקרי שוק, ונותן מידת עניין לאורך זמן (עפ"י חיפושים בגוגל). למשל נרצה לבצע השוואה בין 4-5 יצרנים של נעלי ספורט. עכשיו כולם יודעים בחינם ולבד כבר מי החברות המובילות.
אני קצר בזמן ובמלל, אז החלטתי לשים דגש בפוסט הזה על הנושאים שכתבתי עד כאן. דיברנו בשיעור 3 על הרבה דברים נוספים, ועליהם החלטתי פחות להרחיב: 
  • RSS - המידע יכול לבוא אלינו מעצמו כמובן מאתרים מוכרים. 
  • שמירה על פרטיות בחיפוש - חיפוש מוצפן HTTPS - בשורה תחתונה אל תתנו פרטי אשראי באתרים שהם לא מסומנים בירוק, עם אייקון של מנעול והם מסוג HTTPS!
  • מנוע חיפוש שלא עוקב אחרי המחפש
  • חיפוש ללא זיהוי IP
  • שמירת סימניות וקיצור כתובות אינטרנט
  • ניהול מידע וידע אישי - החשיבות בניהול ידע אישי גם לעובד וגם לארגון
  • 5 המשימות / האתגרים של עובדי ידע:
    • לאתר את המידע הדרוש במהירות
    • להיות מעודכן בשינויים הטכנולוגיים והעסקיים
    • להקדיש זמן לא רק לעבודה אלא גם ללימוד
    • להיות יצירתי ולייצר ידע חדש
    • לבנות יחסי אמון ולתקשר עם העמיתים
לסיכום, דיברנו על הרבה דברים, השיעור הזה הרגיש לי עמוס במידע :) 
אולי זה מסביר למה הפוסט הזה יצא קצת יותר ארוך מהרגיל, למרות כל הנושאים שלא הסברתי עליהם בכלל. ובכל מקרה, למדתי הרבה דברים חדשים ומועילים, אני בטוח שכל אחד למד לפחות דבר או שניים.
המטרה העיקרית שלי כאן הייתה להציג יותר פרקטיקה וכלים שימושיים - להבדיל מהפוסט הראשון שהיה בעיקר הסברים ותאוריה.



2 תגובות:

  1. אי אפשר להעביר הרבה דברים רק בסגנון טלגרפי, אם רוצים שמשהו ייקלט בכל זאת.
    מה שנכון ואני לפחות מתלבט בו תמיד הוא המינון: האם לתא פחות כלים ביתר פירוט, או לתת פירוט קצר יחסית בהנחה שמי שבאמת מתעניין ידע היכן למצוא עוד מידע

    השבמחק
    תשובות
    1. אני מציע שתעשה את השיקול לבחירת הכלים החשובים יותר ועליהם תרחיב. את השאר - לציין ולהסביר באופן כללי. מי שבאמת מתעניין, ידע למצוא עוד חומר, הרי למדנו איך לחפש :) תמיד אפשר להשאיר את הקישורים לקריאה נוספת...

      מחק