llama-cpp-python

abetlen/llama-cpp-python

Fork 0

mirror of https://github.com/abetlen/llama-cpp-python.git synced 2026-03-26 07:21:25 +00:00

Commit Graph

Select branches

Hide Pull Requests

abetlen/bump-version-0.3.18

abetlen/fix-cuda-real-arch

abetlen/fix-hf-download-checks

abetlen/fix-macos-runner-label

abetlen/setup-ruff

abetlen/update-llama-cpp-bindings

add-paligemma-support

batch-processing

binary-wheels

dependabot/github_actions/conda-incubator/setup-miniconda-3.1.1

dependabot/github_actions/pypa/cibuildwheel-2.23.2

dependabot/pip/starlette-context-gte-0.3.6-and-lt-0.5

dev-add-rpc

docker

expose-libggml

fix-embeddings-for-non-embedding-models

fix-windows-import-error

generic-vlm-chat-format

main

patch-1

patch-3

remove-unwanted-bos

update-sampling-api

#10

#1002

#1005

#1007

#1010

#1011

#1012

#1015

#1019

#1021

#1023

#1028

#1037

#1050

#1052

#1058

#1059

#1067

#1067

#1068

#1078

#108

#1080

#1080

#1086

#1087

#1088

#1090

#1092

#1093

#1106

#1106

#111

#1110

#1115

#1116

#1120

#1122

#1131

#1136

#1147

#1156

#1157

#1160

#1160

#1170

#1170

#1172

#1175

#1176

#1179

#118

#1184

#1186

#1187

#1188

#119

#1193

#1194

#1205

#1206

#1209

#1209

#1210

#1212

#1212

#1214

#1222

#1230

#1232

#1244

#1246

#1247

#1248

#125

#1257

#126

#1263

#1264

#1272

#1273

#1281

#1281

#1282

#1289

#1295

#1296

#130

#1307

#1311

#1317

#1330

#1331

#1331

#1333

#1345

#1347

#135

#1350

#1351

#1351

#1353

#1364

#137

#1370

#1371

#1374

#1374

#1375

#1380

#1382

#1382

#1383

#1383

#1385

#1386

#1387

#1388

#139

#1390

#1391

#1392

#1396

#1397

#1398

#1399

#140

#1400

#1401

#1407

#1407

#1408

#1409

#1410

#1411

#1412

#1413

#1415

#1416

#1419

#1424

#1426

#1427

#1427

#1430

#1432

#1433

#1434

#1439

#144

#144

#1440

#1440

#1441

#1444

#1448

#1449

#1453

#1457

#1459

#146

#146

#1462

#1465

#1471

#1472

#1476

#1477

#1486

#1486

#1492

#1493

#1497

#15

#1503

#1503

#1509

#1509

#1513

#1514

#1515

#1515

#1516

#1522

#1525

#1526

#1527

#153

#1530

#1539

#154

#1544

#1550

#1550

#1551

#1552

#1552

#156

#1568

#1569

#157

#1576

#1583

#1583

#1585

#1589

#1590

#1594

#1596

#1597

#160

#1605

#1605

#161

#1613

#1613

#162

#1626

#163

#1630

#1632

#1633

#1634

#1635

#1637

#164

#1649

#165

#1651

#1651

#1653

#1656

#1657

#1658

#1659

#1667

#1668

#1673

#1677

#1677

#1679

#168

#1680

#1704

#1716

#1716

#1718

#1718

#172

#172

#1721

#173

#1738

#1739

#1739

#1741

#1742

#1743

#1750

#1751

#1758

#1758

#176

#176

#1761

#177

#1775

#1776

#1776

#1777

#1777

#178

#1782

#1782

#1783

#1786

#1786

#1788

#1790

#1791

#1791

#1793

#1795

#1796

#1798

#1800

#1800

#1802

#1807

#1817

#1817

#1819

#1820

#1820

#1821

#1825

#1825

#1833

#1834

#1834

#1838

#1842

#1842

#1843

#1843

#1844

#1845

#1858

#1862

#1864

#1864

#1867

#1867

#1871

#1877

#1877

#1878

#1878

#1879

#1884

#1884

#1887

#1887

#189

#1894

#1898

#1899

#1899

#190

#1901

#191

#1911

#1911

#1912

#1959

#1961

#1961

#1966

#1971

#1971

#1973

#1974

#1978

#198

#198

#1980

#1981

#1981

#1989

#1989

#1991

#1991

#2007

#2007

#2009

#2015

#2015

#2018

#2018

#2025

#2025

#2027

#203

#2030

#2034

#2034

#2039

#2039

#2040

#2041

#2041

#2042

#2042

#2044

#2044

#2046

#2049

#2056

#2056

#2058

#2058

#2059

#2059

#2066

#2066

#2071

#2071

#2072

#2072

#2077

#2082

#2082

#2083

#2083

#2085

#2085

#2088

#2088

#2099

#2099

#2100

#2102

#2102

#2108

#2108

#2109

#2109

#2112

#212

#2120

#2120

#2121

#2121

#2128

#2128

#2129

#2129

#2131

#2131

#2132

#2133

#2134

#2134

#2139

#214

#2141

#2141

#2143

#2147

#2147

#2148

#2149

#215

#2150

#2151

#2152

#2153

#2154

#2155

#2156

#2157

#2158

#2160

#2161

#2162

#217

#225

#235

#240

#246

#248

#249

#251

#252

#258

#262

#263

#264

#265

#270

#271

#274

#277

#28

#289

#29

#292

#293

#294

#295

#296

#297

#309

#310

#322

#323

#324

#325

#326

#328

#329

#329

#350

#351

#359

#360

#365

#366

#367

#368

#370

#376

#385

#390

#392

#402

#405

#41

#414

#414

#415

#42

#420

#429

#430

#431

#432

#435

#436

#442

#443

#444

#452

#453

#456

#460

#466

#481

#485

#486

#498

#499

#50

#501

#505

#505

#508

#511

#516

#517

#517

#521

#522

#523

#525

#530

#531

#532

#536

#540

#540

#548

#549

#55

#550

#551

#556

#564

#565

#567

#572

#573

#575

#575

#577

#583

#584

#594

#594

#598

#600

#604

#61

#610

#611

#612

#621

#624

#624

#625

#63

#631

#631

#633

#64

#644

#647

#648

#667

#668

#669

#670

#671

#678

#678

#680

#682

#684

#688

#690

#691

#692

#694

#694

#703

#704

#705

#709

#709

#711

#713

#716

#716

#73

#730

#733

#733

#748

#752

#752

#76

#767

#768

#772

#778

#781

#783

#784

#790

#795

#798

#799

#803

#808

#809

#820

#821

#824

#824

#826

#83

#834

#835

#842

#843

#843

#846

#848

#849

#850

#851

#854

#855

#864

#868

#868

#869

#87

#875

#892

#913

#913

#920

#921

#922

#922

#925

#927

#93

#930

#931

#934

#936

#937

#938

#940

#947

#951

#951

#952

#955

#955

#957

#958

#961

#962

#962

#967

#98

#986

#991

#993

#993

#994

#996

v0.1.29

v0.1.30

v0.1.31

v0.1.32

v0.1.33

v0.1.34

v0.1.35

v0.1.36

v0.1.37

v0.1.38

v0.1.39

v0.1.40

v0.1.41

v0.1.42

v0.1.43

v0.1.44

v0.1.45

v0.1.46

v0.1.47

v0.1.48

v0.1.49

v0.1.50

v0.1.51

v0.1.52

v0.1.53

v0.1.54

v0.1.55

v0.1.56

v0.1.57

v0.1.59

v0.1.60

v0.1.61

v0.1.62

v0.1.63

v0.1.64

v0.1.65

v0.1.66

v0.1.67

v0.1.68

v0.1.69

v0.1.70

v0.1.71

v0.1.72

v0.1.73

v0.1.74

v0.1.75

v0.1.76

v0.1.77

v0.1.78

v0.1.79

v0.1.80

v0.1.81

v0.1.82

v0.1.83

v0.1.84

v0.1.85

v0.2.0

v0.2.1

v0.2.10

v0.2.11

v0.2.12

v0.2.13

v0.2.14

v0.2.15

v0.2.16

v0.2.17

v0.2.18

v0.2.19

v0.2.2

v0.2.20

v0.2.21

v0.2.22

v0.2.23

v0.2.24

v0.2.25

v0.2.26

v0.2.27

v0.2.28

v0.2.29

v0.2.3

v0.2.30

v0.2.31

v0.2.32

v0.2.33

v0.2.34

v0.2.35

v0.2.36

v0.2.37

v0.2.38

v0.2.39

v0.2.4

v0.2.40

v0.2.41

v0.2.42

v0.2.43

v0.2.44

v0.2.45

v0.2.46

v0.2.47

v0.2.48

v0.2.49

v0.2.5

v0.2.50

v0.2.51

v0.2.52

v0.2.53

v0.2.54

v0.2.55

v0.2.56

v0.2.57

v0.2.58

v0.2.59

v0.2.59-cu121

v0.2.59-cu122

v0.2.59-cu123

v0.2.59-metal

v0.2.6

v0.2.60

v0.2.60-cu121

v0.2.60-cu122

v0.2.60-cu123

v0.2.60-metal

v0.2.61

v0.2.61-cu121

v0.2.61-cu122

v0.2.61-cu123

v0.2.61-metal

v0.2.62

v0.2.62-cu121

v0.2.62-cu122

v0.2.62-cu123

v0.2.62-metal

v0.2.63

v0.2.63-cu121

v0.2.63-cu122

v0.2.63-cu123

v0.2.63-metal

v0.2.64

v0.2.64-cu121

v0.2.64-cu122

v0.2.64-cu123

v0.2.64-metal

v0.2.65

v0.2.65-cu121

v0.2.65-cu122

v0.2.65-cu123

v0.2.65-metal

v0.2.66

v0.2.66-cu121

v0.2.66-cu122

v0.2.66-cu123

v0.2.66-cu124

v0.2.66-metal

v0.2.67

v0.2.67-cu121

v0.2.67-cu122

v0.2.67-cu123

v0.2.67-cu124

v0.2.67-metal

v0.2.68

v0.2.68-cu121

v0.2.68-cu122

v0.2.68-cu123

v0.2.68-cu124

v0.2.68-metal

v0.2.69

v0.2.69-cu121

v0.2.69-cu122

v0.2.69-cu123

v0.2.69-cu124

v0.2.69-metal

v0.2.7

v0.2.70

v0.2.70-cu121

v0.2.70-cu122

v0.2.70-cu123

v0.2.70-cu124

v0.2.70-metal

v0.2.71

v0.2.71-cu121

v0.2.71-cu122

v0.2.71-cu123

v0.2.71-cu124

v0.2.71-metal

v0.2.72

v0.2.72-cu121

v0.2.72-cu122

v0.2.72-cu123

v0.2.72-cu124

v0.2.72-metal

v0.2.73

v0.2.73-cu121

v0.2.73-cu122

v0.2.73-cu123

v0.2.73-cu124

v0.2.73-metal

v0.2.74

v0.2.74-cu121

v0.2.74-cu122

v0.2.74-cu123

v0.2.74-cu124

v0.2.74-metal

v0.2.75

v0.2.75-cu121

v0.2.75-cu122

v0.2.75-cu123

v0.2.75-cu124

v0.2.75-metal

v0.2.76

v0.2.76-cu121

v0.2.76-cu122

v0.2.76-cu123

v0.2.76-cu124

v0.2.76-metal

v0.2.77

v0.2.77-cu121

v0.2.77-cu122

v0.2.77-cu123

v0.2.77-cu124

v0.2.77-metal

v0.2.78

v0.2.78-metal

v0.2.79

v0.2.79-metal

v0.2.8

v0.2.80

v0.2.80-metal

v0.2.81

v0.2.81-cu121

v0.2.81-cu122

v0.2.81-cu123

v0.2.81-cu124

v0.2.81-metal

v0.2.82

v0.2.82-cu121

v0.2.82-cu122

v0.2.82-cu123

v0.2.82-cu124

v0.2.82-metal

v0.2.83

v0.2.83-cu121

v0.2.83-cu122

v0.2.83-cu123

v0.2.83-cu124

v0.2.83-metal

v0.2.84

v0.2.84-cu121

v0.2.84-cu122

v0.2.84-cu123

v0.2.84-cu124

v0.2.84-metal

v0.2.85

v0.2.85-cu121

v0.2.85-cu122

v0.2.85-cu123

v0.2.85-cu124

v0.2.85-metal

v0.2.86

v0.2.86-cu121

v0.2.86-cu122

v0.2.86-cu123

v0.2.86-cu124

v0.2.86-metal

v0.2.87

v0.2.87-cu121

v0.2.87-cu122

v0.2.87-cu123

v0.2.87-cu124

v0.2.87-metal

v0.2.88

v0.2.88-cu121

v0.2.88-cu122

v0.2.88-cu123

v0.2.88-cu124

v0.2.88-metal

v0.2.89

v0.2.89-cu121

v0.2.89-cu124

v0.2.89-metal

v0.2.9

v0.2.90

v0.2.90-cu121

v0.2.90-cu122

v0.2.90-cu123

v0.2.90-cu124

v0.2.90-metal

v0.3.0

v0.3.0-metal

v0.3.1

v0.3.1-metal

v0.3.10

v0.3.11

v0.3.11-metal

v0.3.12

v0.3.12-cu121

v0.3.12-cu122

v0.3.12-cu123

v0.3.12-cu124

v0.3.12-metal

v0.3.13

v0.3.13-cu121

v0.3.13-cu122

v0.3.13-cu123

v0.3.13-cu124

v0.3.13-metal

v0.3.14

v0.3.14-cu124

v0.3.14-metal

v0.3.15

v0.3.15-cu121

v0.3.15-cu122

v0.3.15-cu123

v0.3.15-cu124

v0.3.15-metal

v0.3.16

v0.3.16-cu121

v0.3.16-cu122

v0.3.16-cu123

v0.3.16-cu124

v0.3.16-metal

v0.3.17

v0.3.17-metal

v0.3.18

v0.3.18-cu121

v0.3.18-cu122

v0.3.18-cu123

v0.3.18-cu124

v0.3.18-metal

v0.3.19

v0.3.19-cu121

v0.3.19-cu122

v0.3.19-cu123

v0.3.19-cu124

v0.3.19-metal

v0.3.2

v0.3.2-metal

v0.3.3

v0.3.4

v0.3.4-cu121

v0.3.4-cu122

v0.3.4-cu123

v0.3.4-cu124

v0.3.4-metal

v0.3.5

v0.3.5-metal

v0.3.6

v0.3.7

v0.3.8

v0.3.9

ed4e56b6f7 corrected a few Sigbjørn Skjæret 2024-05-11 08:30:09 +02:00
803e8fa1c4 updated comment Sigbjørn Skjæret 2024-05-10 23:11:43 +02:00
a3df77d8d2 tokenize chat format prompts before completion Sigbjørn Skjæret 2024-05-10 23:09:01 +02:00
1547202b77 docs: Fix typo in README.md (#1444) Peng Yu 2024-05-10 10:35:51 -04:00
7f59856fa6 fix: Enable CUDA backend for llava. Closes #1324 Andrei Betlen 2024-05-10 10:18:47 -04:00
73165021bb chore: Bump version v0.2.73-metal v0.2.73-cu124 v0.2.73-cu123 v0.2.73-cu122 v0.2.73-cu121 v0.2.73 Andrei Betlen 2024-05-10 09:44:18 -04:00
eafb6ec5e8 feat: Update llama.cpp Andrei Betlen 2024-05-10 08:39:55 -04:00
ac55d0a175 fix: Clear kv cache to avoid kv bug when image is evaluated first Andrei Betlen 2024-05-10 02:38:10 -04:00
4badac3a60 chore: Bump version v0.2.72-metal v0.2.72-cu124 v0.2.72-cu123 v0.2.72-cu122 v0.2.72-cu121 v0.2.72 Andrei Betlen 2024-05-10 00:56:19 -04:00
561e880654 fix(security): Render all jinja templates in immutable sandbox (#1441) Sigbjørn Skjæret 2024-05-10 06:49:40 +02:00
b454f40a9a Merge pull request from GHSA-56xg-wfcc-g829 Patrick Peng 2024-05-10 12:47:56 +08:00
9d053d6f73 Templates sometimes have BOS in them, remove duplicate Sigbjørn Skjæret 2024-05-09 20:04:06 +02:00
5ab40e6167 feat: Support multiple chat templates - step 1 (#1396) Sigbjørn Skjæret 2024-05-09 15:49:09 +02:00
bf66a283e8 chore: Bump version v0.2.71-metal v0.2.71-cu124 v0.2.71-cu123 v0.2.71-cu122 v0.2.71-cu121 v0.2.71 Andrei Betlen 2024-05-09 03:02:52 -04:00
3757328b70 fix: free last image embed in llava chat handler Andrei Betlen 2024-05-08 22:16:18 -04:00
77122638b4 fix: Make leading bos_token optional for image chat formats, fix nanollava system message Andrei Betlen 2024-05-08 13:12:31 -04:00
2a39b99575 feat: Update llama.cpp Andrei Betlen 2024-05-08 08:42:22 -04:00
9ce5cb376a chore: Bump version v0.2.70-metal v0.2.70-cu124 v0.2.70-cu123 v0.2.70-cu122 v0.2.70-cu121 v0.2.70 Andrei Betlen 2024-05-08 02:36:42 -04:00
4a7122d22f feat: fill-in-middle support (#1386) Sigbjørn Skjæret 2024-05-08 08:26:22 +02:00
228949c1f7 feat: Update llama.cpp Andrei Betlen 2024-05-08 02:22:15 -04:00
903b28adf5 fix: adding missing args in create_completion for functionary chat handler (#1430) Sarunas Kalade 2024-05-08 07:21:27 +01:00
07966b9ba7 docs: update README.md (#1432) Ikko Eltociear Ashimine 2024-05-08 15:20:20 +09:00
a50d24e3a7 fix: chat_format log where auto-detected format prints None (#1434) Bruno Alvisio 2024-05-07 23:19:35 -07:00
0318702cdc feat(server): Add support for setting root_path. Closes #1420 Andrei Betlen 2024-05-05 12:49:31 -04:00
3666833107 feat(ci): Add docker checks and check deps more frequently (#1426) Olivier DEBAUCHE 2024-05-05 18:42:28 +02:00
3e2597eac8 feat: Update llama.cpp Andrei Betlen 2024-05-05 12:12:27 -04:00
e0d7674e62 fix: detokenization case where first token does not start with a leading space (#1375) Noam Gat 2024-05-04 17:14:59 +03:00
1f56c648c3 feat: Implement streaming for Functionary v2 + Bug fixes (#1419) Jeffrey Fong 2024-05-04 22:11:20 +08:00
f9b7221c8f Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2024-05-03 19:07:54 -04:00
9f7a85571a fix: Use memmove to copy str_value kv_override. Closes #1417 Andrei Betlen 2024-05-03 19:07:50 -04:00
0a454bebe6 feat(server): Remove temperature bounds checks for server. Closes #1384 Andrei Betlen 2024-05-03 15:23:06 -04:00
2138561fab fix(server): Propagate flash_attn to model load. (#1424) Daniel Thuerck 2024-05-03 18:17:07 +02:00
2117122396 chore: Bump version v0.2.69-metal v0.2.69-cu124 v0.2.69-cu123 v0.2.69-cu122 v0.2.69-cu121 v0.2.69 Andrei Betlen 2024-05-02 12:07:09 -04:00
d75dea18db feat: Update llama.cpp Andrei Betlen 2024-05-02 12:00:44 -04:00
31b1d95a6c feat: Add llama-3-vision-alpha chat format Andrei Betlen 2024-05-02 11:32:18 -04:00
4f01c452b6 fix: Change default verbose value of verbose in image chat format handlers to True to match Llama Andrei Betlen 2024-04-30 15:50:30 -04:00
946156fb6c feat: Update llama.cpp Andrei Betlen 2024-04-30 15:46:45 -04:00
9286b5caac Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2024-04-30 15:45:36 -04:00
f116175a5a fix: Suppress all logs when verbose=False, use hardcoded fileno's to work in colab notebooks. Closes #796 Closes #729 Andrei Betlen 2024-04-30 15:45:34 -04:00
3226b3c5ef fix: UTF-8 handling with grammars (#1415) Jonathan Soma 2024-04-30 14:33:23 -04:00
945c62c567 docs: Change all examples from interpreter style to script style. Andrei Betlen 2024-04-30 10:15:04 -04:00
26478ab293 docs: Update README.md Andrei Betlen 2024-04-30 10:11:38 -04:00
b14dd98922 chore: Bump version v0.2.68-metal v0.2.68-cu124 v0.2.68-cu123 v0.2.68-cu122 v0.2.68-cu121 v0.2.68 Andrei Betlen 2024-04-30 09:39:56 -04:00
29b6e9a5c8 fix: wrong parameter for flash attention in pickle __getstate__ Andrei Betlen 2024-04-30 09:32:47 -04:00
22d77eefd2 feat: Add option to enable flash_attn to Lllama params and ModelSettings Andrei Betlen 2024-04-30 09:29:16 -04:00
8c2b24d5aa feat: Update llama.cpp Andrei Betlen 2024-04-30 09:27:55 -04:00
6332527a69 fix(ci): Fix build-and-release.yaml (#1413) Olivier DEBAUCHE 2024-04-30 15:16:14 +02:00
c8cd8c17c6 docs: Update README to include CUDA 12.4 wheels v0.2.67-metal v0.2.67-cu124 v0.2.67-cu123 v0.2.67-cu122 v0.2.67-cu121 Andrei Betlen 2024-04-30 03:12:46 -04:00
f417cce28a chore: Bump version v0.2.67 Andrei Betlen 2024-04-30 03:11:02 -04:00
3489ef09d3 fix: Ensure image renders before text in chat formats regardless of message content order. Andrei Betlen 2024-04-30 03:08:46 -04:00
d03f15bb73 fix(ci): Fix bug in use of upload-artifact failing to merge multiple artifacts into a single release. Andrei Betlen 2024-04-30 02:58:55 -04:00
26c7876ba0 chore: Bump version v0.2.66-metal v0.2.66-cu124 v0.2.66-cu123 v0.2.66-cu122 v0.2.66-cu121 v0.2.66 Andrei Betlen 2024-04-30 01:48:40 -04:00
fe2da09538 feat: Generic Chat Formats, Tool Calling, and Huggingface Pull Support for Multimodal Models (Obsidian, LLaVA1.6, Moondream) (#1147) Andrei 2024-04-30 01:35:38 -04:00
64008aa0ee Fix typo generic-vlm-chat-format Andrei Betlen 2024-04-30 01:32:03 -04:00
f70326fa1c Update README Andrei Betlen 2024-04-30 01:30:42 -04:00
6e4ad7246b Fix typo Andrei Betlen 2024-04-30 01:28:18 -04:00
efd99f136b Update README Andrei Betlen 2024-04-30 01:25:50 -04:00
f03326ce5a Update docs Andrei Betlen 2024-04-30 01:13:14 -04:00
fc5d01c321 Update README.md Andrei Betlen 2024-04-30 01:12:14 -04:00
0e15835182 Logits all no longer required for multi-modal models Andrei Betlen 2024-04-30 01:02:57 -04:00
0b891f4038 Re-order multimodal chat formats Andrei Betlen 2024-04-30 00:59:52 -04:00
dd47dda13f Remove unnecessary import Andrei Betlen 2024-04-30 00:49:50 -04:00
c89c6de1f0 Merge branch 'main' into generic-vlm-chat-format Andrei Betlen 2024-04-29 23:57:51 -04:00
97fb860eba feat: Update llama.cpp Andrei Betlen 2024-04-29 23:34:55 -04:00
df2b5b5d44 chore(deps): bump actions/upload-artifact from 3 to 4 (#1412) dependabot[bot] 2024-04-29 22:53:42 -04:00
be43018e09 chore(deps): bump actions/configure-pages from 4 to 5 (#1411) dependabot[bot] 2024-04-29 22:53:21 -04:00
32c000f3ec chore(deps): bump softprops/action-gh-release from 1 to 2 (#1408) dependabot[bot] 2024-04-29 22:52:58 -04:00
03c654a3d9 ci(fix): Workflow actions updates and fix arm64 wheels not included in release (#1392) Olivier DEBAUCHE 2024-04-30 04:52:23 +02:00
0c3bc4b928 fix(ci): Update generate wheel index script to include cu12.3 and cu12.4 Closes #1406 Andrei Betlen 2024-04-29 12:37:22 -04:00
2355ce2227 ci: Add support for pre-built cuda 12.4.1 wheels (#1388) Olivier DEBAUCHE 2024-04-28 05:44:47 +02:00
a411612b38 feat: Add support for str type kv_overrides Andrei Betlen 2024-04-27 23:42:19 -04:00
c9b85bf098 feat: Update llama.cpp Andrei Betlen 2024-04-27 23:41:54 -04:00
22c55cd103 Merge branch 'main' into generic-vlm-chat-format Andrei 2024-04-27 22:34:20 -04:00
8f09d428af Add obisidian support Andrei Betlen 2024-04-27 22:29:02 -04:00
8324ee0c89 Add nanollava support Andrei Betlen 2024-04-27 22:21:53 -04:00
20e0967f14 Add Llava1.6 support Andrei Betlen 2024-04-27 22:14:38 -04:00
0e182be9de Cache last image embed Andrei Betlen 2024-04-27 21:08:27 -04:00
c07db99e5b chore(deps): bump pypa/cibuildwheel from 2.16.5 to 2.17.0 (#1401) dependabot[bot] 2024-04-27 20:51:13 -04:00
7074c4d256 chore(deps): bump docker/build-push-action from 4 to 5 (#1400) dependabot[bot] 2024-04-27 20:51:02 -04:00
79318ba1d1 chore(deps): bump docker/login-action from 2 to 3 (#1399) dependabot[bot] 2024-04-27 20:50:50 -04:00
27038db3d6 chore(deps): bump actions/cache from 3.3.2 to 4.0.2 (#1398) dependabot[bot] 2024-04-27 20:50:39 -04:00
17bdfc818f chore(deps): bump conda-incubator/setup-miniconda from 2.2.0 to 3.0.4 (#1397) dependabot[bot] 2024-04-27 20:50:28 -04:00
f178636e1b fix: Functionary bug fixes (#1385) Jeffrey Fong 2024-04-28 08:49:52 +08:00
e6bbfb863c examples: fix quantize example (#1387) iyubondyrev 2024-04-28 02:48:47 +02:00
c58b56123d ci: Update action versions in build-wheels-metal.yaml (#1390) Olivier DEBAUCHE 2024-04-28 02:47:49 +02:00
9e7f738220 ci: Update dependabot.yml (#1391) Olivier DEBAUCHE 2024-04-28 02:47:07 +02:00
94fe4bca1c Add function calling support Andrei Betlen 2024-04-27 17:32:51 -04:00
fd55c29a58 Update moondream prompt Andrei Betlen 2024-04-27 16:40:40 -04:00
1705893ced Update moondream chat format Andrei Betlen 2024-04-27 16:38:31 -04:00
7df9483f62 Update moondream chat format Andrei Betlen 2024-04-27 15:40:38 -04:00
2fd41f9cce Add moondream support (wip) Andrei Betlen 2024-04-27 13:19:24 -04:00
3cef09cf2d Revert chat format test Andrei Betlen 2024-04-27 12:59:56 -04:00
d7b28f709f Refactor llava chat format to use a jinja2 Andrei Betlen 2024-04-27 12:59:16 -04:00
a3c3b5df68 Add from_pretrained support to llava chat format. Andrei Betlen 2024-04-27 12:58:40 -04:00
b78ed72fc6 Format and improve types for llava_cpp.py Andrei Betlen 2024-04-27 12:57:35 -04:00
b7338a049b Merge branch 'main' into generic-vlm-chat-format Andrei 2024-04-27 12:56:18 -04:00
65edc90671 chore: Bump version v0.2.65-metal v0.2.65-cu123 v0.2.65-cu122 v0.2.65-cu121 v0.2.65 Andrei Betlen 2024-04-26 10:11:31 -04:00
173ebc7878 fix: Remove duplicate pooling_type definition and add misisng n_vocab definition in bindings Andrei Betlen 2024-04-25 21:36:09 -04:00
f6ed21f9a2 feat: Allow for possibly non-pooled embeddings (#1380) Douglas Hanley 2024-04-25 20:32:44 -05:00
fcfea66857 fix: pydantic deprecation warning Andrei Betlen 2024-04-25 21:21:48 -04:00

... 3 4 5 6 7 ...