נתונים כלליים | |
---|---|
סוג | חברה פרטית |
מייסדים | קלמנט דלנג, ז'וליאן שאמון, תומס וולף |
תקופת הפעילות | 2016–הווה (כ־8 שנים) |
חברות בנות | Hugging Face SAS |
מיקום המטה | ניו יורק סיטי, ארצות הברית |
מוצרים עיקריים | Transformers, datasets, spaces, Hugging Face Hub |
הכנסות | 15,000,000 דולר אמריקאי (נכון ל־2022) |
עובדים | 170 (נכון ל־אוגוסט 2023) |
huggingface.co | |
Hugging Face היא חברה אמריקאית המפתחת כלים לבניית יישומים באמצעות למידת מכונה.[1] בין מוצרי הדגל של החברה בולטת ספריית הטרנספורמרים שלה שנבנתה עבור יישומי עיבוד שפה טבעית. בנוסף, לחברה פלטפורמה בשם Hugging Face Hub, המאפשרת למשתמשים לשתף מודלים ומערכי נתונים של למידת מכונה בקוד פתוח. על אף שמדובר בחברה פרטית, נכון ל-2023 אופי החברה דוגל בשיתופיות והנגשת מודלי שפה גדולים, הנחשבת לנחלתם של תאגידים טכנולוגיים, לכלל קהילת המפתחים.[2]
החברה נוסדה ב-2016 על ידי היזמים הצרפתים קלמנט דלאנג, ז'וליאן שאמון ותומס וולף. מטרת החברה בעת היווסדה הייתה פיתוח אפליקציית צ'אטבוט המיועדת לבני נוער. [3] לאחר שהחברה פרסמה בקוד פתוח את המודל שעמד בבסיס הצ'אטבוט, החלה החברה לפנות לכיוון פיתוח פלטפורמה פתוחה למודלי למידת מכונה.
במרץ 2021 גייסה החברה 40 מיליון דולר בסבב גיוס B.[4]
ב-28 באפריל 2021, החברה השיקה את סדנת המחקר BigScience בשיתוף עם מספר קבוצות מחקר אחרות, במטרה לשחרר לקהילה מודל שפה גדול בקוד פתוח.[5] בשנת 2022 הסתיימה הסדנה בהכרזה על BLOOM, מודל שפה רב לשוני עם 176 מיליארד פרמטרים.[6]
ב-21 בדצמבר 2021, החברה הודיעה על רכישת Gradio, ספריית תוכנה המשמשת להדגמות דפדפן אינטראקטיביות של מודלים של למידת מכונה.[7]
ב-5 במאי 2022, החברה הודיעה על סבב גיוס נוסף, לפי שווי של 2 מיליארד דולר.[8]
ב-3 באוגוסט 2022, החברה הכריזה על Private Hub, גרסה פרטית עם ייעוד ארגוני של פלטפורמת המודלים הפתוחה Hugging Face Hub.[9]
בפברואר 2023, החברה הודיעה על שותפות עם Amazon Web Services (AWS) שתאפשר ללקוחות AWS שימוש מותאם אישית במוצרים של Hugging Face. עוד הודיעה כי הדור הבא של מודל השפה BLOOM יופעל על Trainium, שבב למידת מכונה קנייני שנוצר על ידי AWS.[10][11]
באוגוסט 2023, הודיעה החברה כי גייסה 235 מיליון דולר, לפי שווי של 4.5 מיליארד דולר. המימון הובל על ידי Salesforce, בשיתוף ענקיות טכנולוגיה נוספות, בהן גוגל, אמזון, אנבידיה, AMD, אינטל, יבמ וקוואלקום.[12]
ספריית Transformers היא חבילת פייתון המכילה יישומי קוד פתוח של מודלי טרנספורמר הנועדו לבצע משימות מתחום ניתוחי הטקסט, התמונה והאודיו. הספרייה מותאמת לפרויקטים המשתמשים בספריות הלמידה העמוקה הפופולריות ביותר PyTorch, TensorFlow ו- JAX, ומוטמעים בה מודלי שפה בולטים דוגמת BERT ו- GPT-2.[13]
הספרייה מסוגלת לבצע משימות ספציפיות מתחום למידת המכונה. כך למשל, על מנת לבצע ניתוח סנטימנט (זיהוי האם הרגש הנובע מטקסט הוא חיובי או שלילי), ניתן להשתמש בספריה כך:
from transformers import pipeline
sentiment_pipeline = pipeline("sentiment-analysis")
data = ["I love you", "I hate you"]
sentiment_pipeline(data)
כאשר התוצאה במקרה זה תהיה:
[{'label': 'POSITIVE', 'score': 0.9998},
{'label': 'NEGATIVE', 'score': 0.9991}]
בנוסף לביצוע משימות ייעודיות, הספריה כוללת גם כלי עזר לאימון מודלים. בהם, למשל, Tokenizer, הממירה טקסט לייצוג וקטוריאלי של ספרות (שלב נדרש באימון מודלי שפה).
Hugging Face Hub היא פלטפורמה (שירות אינטרנט מרכזי) לאירוח:[14]
לחברה צ'אטבוט מקוון בשם Hugging Chat,[16] המבוסס על מודל שפה גדול בקוד פתוח, אשר ניתן לשוחח עמו בדומה ל-ChatGPT. נכון ליולי 2023, הצ'אטבוט מבוסס על מודל LLaMA-2 של חברת מטא.[17]
בנוסף לשתי הספריות האמורות, Hugging Face כוללת ספריות פייתון למשימות נוספות, כגון datasets לעיבוד נתונים, Evaluate להערכת מודלים, Simulate להרצת סימולציות ועוד.[18]
((cite web))
: (עזרה)
((cite web))
: (עזרה)
((cite web))
: (עזרה)