Persimmon-8B: открытая модель с длиной контекста 16k токенов, работающая на одном GPU
11 сентября 2023
Persimmon-8B: открытая модель с длиной контекста 16k токенов, работающая на одном GPU
Исследователи из Adept представили open source языковую модель Persimmon-8B c длиной контекста 16k токенов, что в 4 раза больше самой компактной Llama 2 и text-davinci-002, используемой в GPT-3.5. Длинный контекст…