6-те най-добри предварително обучени модели за работа и бизнес - |Обяснение на технологията|Програмиране|

Читатели като вас помагат в подкрепа на MUO. Когато правите покупка чрез връзки на нашия сайт, ние може да спечелим комисионна за партньор. Прочетете още.

Бариерата пред обучението на ефективен и надежден AI е значително намалена благодарение на публичното пускане на много предварително обучени модели. С предварително обучените модели независимите изследователи и по-малките предприятия могат да рационализират процесите, да подобрят производителността и да получат ценна информация чрез използването на AI.

MUO видео на деня ПРЕВЪРТЕТЕ, ЗА ДА ПРОДЪЛЖИТЕ СЪС СЪДЪРЖАНИЕТО

Вече има много предварително обучени модели, които можете да използвате и прецизирате. В зависимост от конкретния ви проблем може да искате да използвате един модел пред друг. И така, как да разберете кой предварително обучен модел да използвате?

За да ви помогнем да решите, ето някои от най-популярните предварително обучени модели, които можете да използвате, за да повишите производителността на работата и бизнеса си.

1. BERT (Двупосочни представяния на енкодери от трансформатори)

BERT е енкодер трансформатор, който революционизира обработката на естествения език (NLP) със своя механизъм за самовнимание. За разлика от традиционните повтарящи се невронни мрежи (RNN), които обработват изречения една дума след друга, механизмът за самовнимание на BERT позволява на модела да претегля важността на думите в последователност, като изчислява оценки за внимание между тях.

Моделите BERT имат способността да разбират по-дълбокия контекст в поредица от думи. Това прави моделите BERT идеални за приложения, които изискват мощно контекстуално вграждане, което има силна производителност при различни NLP задачи, като класификация на текст, разпознаване на именуван обект и отговаряне на въпроси.

Моделите BERT обикновено са големи и изискват скъп хардуер за обучение. Така че, въпреки че се смята за най-доброто за много приложения на НЛП, недостатъкът на обучението на BERT модели е, че процесът често е скъп и отнема много време.

как да възстановите фабричните настройки на windows 10 от bios

2. DistilBERT (дестилиран BERT):

Търсите фина настройка на модел BERT, но нямате необходимите пари или време? DistilBERT е дестилирана версия на BERT, която запазва около 95% от своята производителност, като използва само половината от броя на параметрите!

DistilBERT използва подход за обучение учител-ученик, при който BERT е учителят, а DistilBERT е ученикът. Процесът на обучение включва дестилиране на знанията на учителя към ученика чрез обучение на DistilBERT да имитира поведението и изходните вероятности BERT.

Благодарение на процеса на дестилация, DistilBERT няма вграждания от тип токен, има намалени глави за внимание и по-малко слоеве за подаване напред. Това постига значително по-малък размер на модела, но жертва известна производителност.

Точно като BERT, DistilBERT се използва най-добре при класифициране на текст, разпознаване на именувани обекти, текстово сходство и парафразиране, отговаряне на въпроси и анализ на настроението. Използването на DistilBERT може да не ви осигури същото ниво на точност, както при BERT. Използването на DistilBERT обаче ви позволява да прецизирате вашия модел много по-бързо, като същевременно харчите по-малко за обучение.

как да изтриете файл, който се използва от друга програма

3. GPT (генеративен предварително обучен трансформатор)

Кредит за изображение: ilgmyzin/ Unplash

Имате ли нужда от нещо, което да ви помогне да генерирате съдържание, да дадете предложения или да обобщите текст? GPT е предварително обучен модел на OpenAI, който произвежда съгласувани и контекстуално подходящи текстове.

За разлика от BERT, който е проектиран под архитектурата на трансформатора на енкодера, GPT е проектиран като трансформатор на декодера. Това позволява на GPT да бъде отличен в предвиждането на следващите думи въз основа на контекста на предишната последователност. Обучен върху огромни количества текст в интернет, GPT научи модели и връзки между думи и изречения. Това позволява на GPT да знае кои думи са най-подходящи за използване в определен сценарий. Тъй като е популярен предварително обучен модел, има разширени инструменти като AutoGPT които можете да използвате в полза на вашата работа и бизнес.

Въпреки че чудесно имитира човешкия език, GPT няма никаква основа във факти освен набора от данни, използван за обучение на модела. Тъй като го интересува само дали генерира думи, които имат смисъл въз основа на контекста на предишни думи, той може да предоставя неправилни, измислени или нефактически отговори от време на време. Друг проблем, който може да имате при фина настройка на GPT, е, че OpenAI позволява достъп само чрез API. Така че, независимо дали искате да настроите фино GPT или просто продължавайте да обучавате ChatGPT с персонализираните си данни , ще трябва да платите за API ключ.

4. T5 (Трансформатор за прехвърляне на текст в текст)

T5 е много гъвкав модел на НЛП, който съчетава архитектури на енкодер и декодер, за да се справи с широк спектър от задачи на НЛП. T5 може да се използва за класифициране на текст, обобщение, превод, отговаряне на въпроси и анализ на настроението.

С T5, който има малък, основен и голям размер на модела, можете да получите трансформаторен модел енкодер-декодер, който отговаря по-добре на вашите нужди по отношение на производителност, точност, време за обучение и цена на фина настройка. Моделите T5 се използват най-добре, когато можете да приложите само един модел за вашите приложения за NLP задачи. Въпреки това, ако трябва да имате най-доброто НЛП представяне, може да искате да използвате отделен модел за задачи за кодиране и декодиране.

5. ResNet (остатъчна невронна мрежа)

Търсите модел, който може да изпълнява задачи за компютърно зрение? ResNet е модел за задълбочено обучение, проектиран съгласно архитектурата на конволюционната невронна мрежа (CNN), който е полезен за задачи с компютърно зрение като разпознаване на изображения, откриване на обекти и семантично сегментиране. Тъй като ResNet е популярен предварително обучен модел, можете да намерите фино настроени модели, след което да ги използвате трансфер на обучение за по-бързо обучение на модели .

ResNet работи, като първо разбира разликата между входа и изхода, известна още като 'остатъци'. След идентифициране на остатъците, ResNet се фокусира върху намирането на най-вероятното между тези входове и изходи. Чрез обучението на ResNet върху голям набор от данни, моделът научи сложни модели и функции и може да разбере как обикновено изглеждат обектите, правейки ResNet отличен в запълването на междинните интервали на входа и изхода на изображението.

Тъй като ResNet развива своето разбиране само въз основа на дадения набор от данни, прекомерното оборудване може да е проблем. Това означава, че ако наборът от данни за конкретен субект е бил недостатъчен, ResNet може погрешно да идентифицира субект. Така че, ако трябва да използвате модел ResNet, ще трябва да настроите фино модела със значителен набор от данни, за да осигурите надеждност.

6. VGGNet (Групова мрежа за визуална геометрия)

VGGNet е друг популярен модел за компютърно зрение, който е по-лесен за разбиране и прилагане от ResNet. Въпреки че е по-малко мощен, VGGNet използва по-прост подход от ResNet, като използва еднаква архитектура, която разбива изображенията на по-малки части и след това постепенно научава нейните характеристики.

как да изтриете редове в word

С този по-опростен метод за анализиране на изображения VGGNet е по-лесен за разбиране, прилагане и модифициране дори за сравнително нови изследователи или практикуващи задълбочено обучение. Може също да искате да използвате VGGNet над ResNet, ако имате ограничен набор от данни и ресурси и искате да настроите фино модела, за да бъде по-ефективен в конкретна област.

Налични са много други предварително обучени модели

Надяваме се, че вече имате по-добра представа какви предварително обучени модели можете да използвате за вашия проект. Обсъжданите модели са едни от най-популярните по отношение на съответните области. Имайте предвид, че има много други предварително обучени модели, публично достъпни в библиотеки за дълбоко обучение, като TensorFlow Hub и PyTorch.

Освен това не е нужно да се придържате само към един предварително обучен модел. Стига да имате ресурсите и времето, винаги можете да внедрите множество предварително обучени модели, които са от полза за вашето приложение.