llama-cpp-python

abetlen/llama-cpp-python

Fork 0

mirror of https://github.com/abetlen/llama-cpp-python.git synced 2026-03-27 05:33:00 +00:00

Commit Graph

Select branches

Hide Pull Requests

abetlen/bump-version-0.3.18

abetlen/fix-cuda-real-arch

abetlen/fix-hf-download-checks

abetlen/fix-macos-runner-label

abetlen/setup-ruff

abetlen/update-llama-cpp-bindings

add-paligemma-support

batch-processing

binary-wheels

dependabot/github_actions/conda-incubator/setup-miniconda-3.1.1

dependabot/github_actions/pypa/cibuildwheel-2.23.2

dependabot/pip/starlette-context-gte-0.3.6-and-lt-0.5

dev-add-rpc

docker

expose-libggml

fix-embeddings-for-non-embedding-models

fix-windows-import-error

generic-vlm-chat-format

main

patch-1

patch-3

remove-unwanted-bos

update-sampling-api

#10

#1002

#1005

#1007

#1010

#1011

#1012

#1015

#1019

#1021

#1023

#1028

#1037

#1050

#1052

#1058

#1059

#1067

#1067

#1068

#1078

#108

#1080

#1080

#1086

#1087

#1088

#1090

#1092

#1093

#1106

#1106

#111

#1110

#1115

#1116

#1120

#1122

#1131

#1136

#1147

#1156

#1157

#1160

#1160

#1170

#1170

#1172

#1175

#1176

#1179

#118

#1184

#1186

#1187

#1188

#119

#1193

#1194

#1205

#1206

#1209

#1209

#1210

#1212

#1212

#1214

#1222

#1230

#1232

#1244

#1246

#1247

#1248

#125

#1257

#126

#1263

#1264

#1272

#1273

#1281

#1281

#1282

#1289

#1295

#1296

#130

#1307

#1311

#1317

#1330

#1331

#1331

#1333

#1345

#1347

#135

#1350

#1351

#1351

#1353

#1364

#137

#1370

#1371

#1374

#1374

#1375

#1380

#1382

#1382

#1383

#1383

#1385

#1386

#1387

#1388

#139

#1390

#1391

#1392

#1396

#1397

#1398

#1399

#140

#1400

#1401

#1407

#1407

#1408

#1409

#1410

#1411

#1412

#1413

#1415

#1416

#1419

#1424

#1426

#1427

#1427

#1430

#1432

#1433

#1434

#1439

#144

#144

#1440

#1440

#1441

#1444

#1448

#1449

#1453

#1457

#1459

#146

#146

#1462

#1465

#1471

#1472

#1476

#1477

#1486

#1486

#1492

#1493

#1497

#15

#1503

#1503

#1509

#1509

#1513

#1514

#1515

#1515

#1516

#1522

#1525

#1526

#1527

#153

#1530

#1539

#154

#1544

#1550

#1550

#1551

#1552

#1552

#156

#1568

#1569

#157

#1576

#1583

#1583

#1585

#1589

#1590

#1594

#1596

#1597

#160

#1605

#1605

#161

#1613

#1613

#162

#1626

#163

#1630

#1632

#1633

#1634

#1635

#1637

#164

#1649

#165

#1651

#1651

#1653

#1656

#1657

#1658

#1659

#1667

#1668

#1673

#1677

#1677

#1679

#168

#1680

#1704

#1716

#1716

#1718

#1718

#172

#172

#1721

#173

#1738

#1739

#1739

#1741

#1742

#1743

#1750

#1751

#1758

#1758

#176

#176

#1761

#177

#1775

#1776

#1776

#1777

#1777

#178

#1782

#1782

#1783

#1786

#1786

#1788

#1790

#1791

#1791

#1793

#1795

#1796

#1798

#1800

#1800

#1802

#1807

#1817

#1817

#1819

#1820

#1820

#1821

#1825

#1825

#1833

#1834

#1834

#1838

#1842

#1842

#1843

#1843

#1844

#1845

#1858

#1862

#1864

#1864

#1867

#1867

#1871

#1877

#1877

#1878

#1878

#1879

#1884

#1884

#1887

#1887

#189

#1894

#1898

#1899

#1899

#190

#1901

#191

#1911

#1911

#1912

#1959

#1961

#1961

#1966

#1971

#1971

#1973

#1974

#1978

#198

#198

#1980

#1981

#1981

#1989

#1989

#1991

#1991

#2007

#2007

#2009

#2015

#2015

#2018

#2018

#2025

#2025

#2027

#203

#2030

#2034

#2034

#2039

#2039

#2040

#2041

#2041

#2042

#2042

#2044

#2044

#2046

#2049

#2056

#2056

#2058

#2058

#2059

#2059

#2066

#2066

#2071

#2071

#2072

#2072

#2077

#2082

#2082

#2083

#2083

#2085

#2085

#2088

#2088

#2099

#2099

#2100

#2102

#2102

#2108

#2108

#2109

#2109

#2112

#212

#2120

#2120

#2121

#2121

#2128

#2128

#2129

#2129

#2131

#2131

#2132

#2133

#2134

#2134

#2139

#214

#2141

#2141

#2143

#2147

#2147

#2148

#2149

#215

#2150

#2151

#2152

#2153

#2154

#2155

#2156

#2157

#2158

#2160

#2161

#2162

#2164

#2164

#217

#225

#235

#240

#246

#248

#249

#251

#252

#258

#262

#263

#264

#265

#270

#271

#274

#277

#28

#289

#29

#292

#293

#294

#295

#296

#297

#309

#310

#322

#323

#324

#325

#326

#328

#329

#329

#350

#351

#359

#360

#365

#366

#367

#368

#370

#376

#385

#390

#392

#402

#405

#41

#414

#414

#415

#42

#420

#429

#430

#431

#432

#435

#436

#442

#443

#444

#452

#453

#456

#460

#466

#481

#485

#486

#498

#499

#50

#501

#505

#505

#508

#511

#516

#517

#517

#521

#522

#523

#525

#530

#531

#532

#536

#540

#540

#548

#549

#55

#550

#551

#556

#564

#565

#567

#572

#573

#575

#575

#577

#583

#584

#594

#594

#598

#600

#604

#61

#610

#611

#612

#621

#624

#624

#625

#63

#631

#631

#633

#64

#644

#647

#648

#667

#668

#669

#670

#671

#678

#678

#680

#682

#684

#688

#690

#691

#692

#694

#694

#703

#704

#705

#709

#709

#711

#713

#716

#716

#73

#730

#733

#733

#748

#752

#752

#76

#767

#768

#772

#778

#781

#783

#784

#790

#795

#798

#799

#803

#808

#809

#820

#821

#824

#824

#826

#83

#834

#835

#842

#843

#843

#846

#848

#849

#850

#851

#854

#855

#864

#868

#868

#869

#87

#875

#892

#913

#913

#920

#921

#922

#922

#925

#927

#93

#930

#931

#934

#936

#937

#938

#940

#947

#951

#951

#952

#955

#955

#957

#958

#961

#962

#962

#967

#98

#986

#991

#993

#993

#994

#996

v0.1.29

v0.1.30

v0.1.31

v0.1.32

v0.1.33

v0.1.34

v0.1.35

v0.1.36

v0.1.37

v0.1.38

v0.1.39

v0.1.40

v0.1.41

v0.1.42

v0.1.43

v0.1.44

v0.1.45

v0.1.46

v0.1.47

v0.1.48

v0.1.49

v0.1.50

v0.1.51

v0.1.52

v0.1.53

v0.1.54

v0.1.55

v0.1.56

v0.1.57

v0.1.59

v0.1.60

v0.1.61

v0.1.62

v0.1.63

v0.1.64

v0.1.65

v0.1.66

v0.1.67

v0.1.68

v0.1.69

v0.1.70

v0.1.71

v0.1.72

v0.1.73

v0.1.74

v0.1.75

v0.1.76

v0.1.77

v0.1.78

v0.1.79

v0.1.80

v0.1.81

v0.1.82

v0.1.83

v0.1.84

v0.1.85

v0.2.0

v0.2.1

v0.2.10

v0.2.11

v0.2.12

v0.2.13

v0.2.14

v0.2.15

v0.2.16

v0.2.17

v0.2.18

v0.2.19

v0.2.2

v0.2.20

v0.2.21

v0.2.22

v0.2.23

v0.2.24

v0.2.25

v0.2.26

v0.2.27

v0.2.28

v0.2.29

v0.2.3

v0.2.30

v0.2.31

v0.2.32

v0.2.33

v0.2.34

v0.2.35

v0.2.36

v0.2.37

v0.2.38

v0.2.39

v0.2.4

v0.2.40

v0.2.41

v0.2.42

v0.2.43

v0.2.44

v0.2.45

v0.2.46

v0.2.47

v0.2.48

v0.2.49

v0.2.5

v0.2.50

v0.2.51

v0.2.52

v0.2.53

v0.2.54

v0.2.55

v0.2.56

v0.2.57

v0.2.58

v0.2.59

v0.2.59-cu121

v0.2.59-cu122

v0.2.59-cu123

v0.2.59-metal

v0.2.6

v0.2.60

v0.2.60-cu121

v0.2.60-cu122

v0.2.60-cu123

v0.2.60-metal

v0.2.61

v0.2.61-cu121

v0.2.61-cu122

v0.2.61-cu123

v0.2.61-metal

v0.2.62

v0.2.62-cu121

v0.2.62-cu122

v0.2.62-cu123

v0.2.62-metal

v0.2.63

v0.2.63-cu121

v0.2.63-cu122

v0.2.63-cu123

v0.2.63-metal

v0.2.64

v0.2.64-cu121

v0.2.64-cu122

v0.2.64-cu123

v0.2.64-metal

v0.2.65

v0.2.65-cu121

v0.2.65-cu122

v0.2.65-cu123

v0.2.65-metal

v0.2.66

v0.2.66-cu121

v0.2.66-cu122

v0.2.66-cu123

v0.2.66-cu124

v0.2.66-metal

v0.2.67

v0.2.67-cu121

v0.2.67-cu122

v0.2.67-cu123

v0.2.67-cu124

v0.2.67-metal

v0.2.68

v0.2.68-cu121

v0.2.68-cu122

v0.2.68-cu123

v0.2.68-cu124

v0.2.68-metal

v0.2.69

v0.2.69-cu121

v0.2.69-cu122

v0.2.69-cu123

v0.2.69-cu124

v0.2.69-metal

v0.2.7

v0.2.70

v0.2.70-cu121

v0.2.70-cu122

v0.2.70-cu123

v0.2.70-cu124

v0.2.70-metal

v0.2.71

v0.2.71-cu121

v0.2.71-cu122

v0.2.71-cu123

v0.2.71-cu124

v0.2.71-metal

v0.2.72

v0.2.72-cu121

v0.2.72-cu122

v0.2.72-cu123

v0.2.72-cu124

v0.2.72-metal

v0.2.73

v0.2.73-cu121

v0.2.73-cu122

v0.2.73-cu123

v0.2.73-cu124

v0.2.73-metal

v0.2.74

v0.2.74-cu121

v0.2.74-cu122

v0.2.74-cu123

v0.2.74-cu124

v0.2.74-metal

v0.2.75

v0.2.75-cu121

v0.2.75-cu122

v0.2.75-cu123

v0.2.75-cu124

v0.2.75-metal

v0.2.76

v0.2.76-cu121

v0.2.76-cu122

v0.2.76-cu123

v0.2.76-cu124

v0.2.76-metal

v0.2.77

v0.2.77-cu121

v0.2.77-cu122

v0.2.77-cu123

v0.2.77-cu124

v0.2.77-metal

v0.2.78

v0.2.78-metal

v0.2.79

v0.2.79-metal

v0.2.8

v0.2.80

v0.2.80-metal

v0.2.81

v0.2.81-cu121

v0.2.81-cu122

v0.2.81-cu123

v0.2.81-cu124

v0.2.81-metal

v0.2.82

v0.2.82-cu121

v0.2.82-cu122

v0.2.82-cu123

v0.2.82-cu124

v0.2.82-metal

v0.2.83

v0.2.83-cu121

v0.2.83-cu122

v0.2.83-cu123

v0.2.83-cu124

v0.2.83-metal

v0.2.84

v0.2.84-cu121

v0.2.84-cu122

v0.2.84-cu123

v0.2.84-cu124

v0.2.84-metal

v0.2.85

v0.2.85-cu121

v0.2.85-cu122

v0.2.85-cu123

v0.2.85-cu124

v0.2.85-metal

v0.2.86

v0.2.86-cu121

v0.2.86-cu122

v0.2.86-cu123

v0.2.86-cu124

v0.2.86-metal

v0.2.87

v0.2.87-cu121

v0.2.87-cu122

v0.2.87-cu123

v0.2.87-cu124

v0.2.87-metal

v0.2.88

v0.2.88-cu121

v0.2.88-cu122

v0.2.88-cu123

v0.2.88-cu124

v0.2.88-metal

v0.2.89

v0.2.89-cu121

v0.2.89-cu124

v0.2.89-metal

v0.2.9

v0.2.90

v0.2.90-cu121

v0.2.90-cu122

v0.2.90-cu123

v0.2.90-cu124

v0.2.90-metal

v0.3.0

v0.3.0-metal

v0.3.1

v0.3.1-metal

v0.3.10

v0.3.11

v0.3.11-metal

v0.3.12

v0.3.12-cu121

v0.3.12-cu122

v0.3.12-cu123

v0.3.12-cu124

v0.3.12-metal

v0.3.13

v0.3.13-cu121

v0.3.13-cu122

v0.3.13-cu123

v0.3.13-cu124

v0.3.13-metal

v0.3.14

v0.3.14-cu124

v0.3.14-metal

v0.3.15

v0.3.15-cu121

v0.3.15-cu122

v0.3.15-cu123

v0.3.15-cu124

v0.3.15-metal

v0.3.16

v0.3.16-cu121

v0.3.16-cu122

v0.3.16-cu123

v0.3.16-cu124

v0.3.16-metal

v0.3.17

v0.3.17-metal

v0.3.18

v0.3.18-cu121

v0.3.18-cu122

v0.3.18-cu123

v0.3.18-cu124

v0.3.18-metal

v0.3.19

v0.3.19-cu121

v0.3.19-cu122

v0.3.19-cu123

v0.3.19-cu124

v0.3.19-metal

v0.3.2

v0.3.2-metal

v0.3.3

v0.3.4

v0.3.4-cu121

v0.3.4-cu122

v0.3.4-cu123

v0.3.4-cu124

v0.3.4-metal

v0.3.5

v0.3.5-metal

v0.3.6

v0.3.7

v0.3.8

v0.3.9

89cce50f8c Update llama.cpp Andrei Betlen 2024-01-18 21:21:49 -05:00
b8fc1c7d83 feat: Add ability to load chat format from huggingface autotokenizer or tokenizer_config.json files. Andrei Betlen 2024-01-18 21:21:37 -05:00
48c3b77e6f Offload KQV by default Andrei Betlen 2024-01-18 11:08:57 -05:00
850416ae82 Merge branch 'main' into batch-processing batch-processing Andrei Betlen 2024-01-18 08:49:00 -05:00
6f08021280 Cleanup pyproject Andrei Betlen 2024-01-17 09:48:46 -05:00
6bfe98bd80 Integration of Jinja2 Templating (#875) Austin 2024-01-17 09:47:52 -05:00
52adc23115 Update llama.cpp Andrei Betlen 2024-01-17 09:27:40 -05:00
7b46bb5a78 Re-order classes in llama.py Andrei Betlen 2024-01-17 09:16:13 -05:00
cc4630e66f Move helper classes to _internals submodule Andrei Betlen 2024-01-17 09:14:00 -05:00
3b92419132 Move cache classes to llama_cache submodule. Andrei Betlen 2024-01-17 09:09:12 -05:00
6981597835 Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into main Andrei Betlen 2024-01-16 19:35:59 -05:00
d5dbb3f8de Update llama.cpp Andrei Betlen 2024-01-16 19:35:57 -05:00
84380fe9a6 Add llamaindex integration to readme (#1092) Jerry Liu 2024-01-16 16:10:50 -08:00
9c36688b33 fix(cli): allow passing n_ctx=0 to openAI API server args to use model n_ctx_train field per #1015 (#1093) Kyle Mistele 2024-01-16 17:54:06 -06:00
cfb7da98ed Support Accept text/event-stream in chat and completion endpoints, resolves #1083 (#1088) anil 2024-01-16 11:52:52 -06:00
e39778f8eb Update llama.cpp Andrei Betlen 2024-01-16 11:56:44 -05:00
e7ef07db96 Merge branch 'batch-processing' of github.com:abetlen/llama_cpp_python into batch-processing Andrei Betlen 2024-01-15 17:50:36 -05:00
358593fc9e Merge branch 'main' into batch-processing Andrei Betlen 2024-01-15 17:50:26 -05:00
4b11fa83c0 Bump version v0.2.29 Andrei Betlen 2024-01-15 12:54:51 -05:00
84615adbc6 Add split_mode option. Closes #1085 Andrei Betlen 2024-01-15 12:49:20 -05:00
76aafa6149 Implement GGUF metadata KV overrides (#1011) Phil H 2024-01-15 17:29:29 +00:00
7eff42c239 Avoid "LookupError: unknown encoding: ascii" when open() called in a destructor (#1012) yieldthought 2024-01-15 16:52:10 +01:00
1eaace8ea3 Fix low_level_api_chat_cpp example to match current API (#1086) anil 2024-01-15 09:46:35 -06:00
c689ccc728 Fix Pydantic model parsing (#1087) Mark Neumann 2024-01-15 07:45:57 -08:00
5502ac8876 Update llama.cpp Andrei Betlen 2024-01-15 10:12:10 -05:00
359ae73643 Update llama.cpp Andrei Betlen 2024-01-14 08:17:22 -05:00
7c898d5684 Update llama.cpp Andrei Betlen 2024-01-13 22:37:49 -05:00
7a1c2b5d2e Merge branch 'main' of https://github.com/abetlen/llama-cpp-python into batch-processing Andrei Betlen 2024-01-12 02:18:21 -05:00
bb610b9428 Update llama.cpp Andrei Betlen 2024-01-11 22:51:12 -05:00
7f4ba48ada Use sampling context Andrei Betlen 2024-01-10 08:29:54 -05:00
456a601842 Merge branch 'main' into batch-processing Andrei Betlen 2024-01-10 03:19:11 -05:00
f0159663d9 Bump version v0.2.28 Andrei Betlen 2024-01-10 02:51:17 -05:00
df3be58d6c Add ability to pass in penalize_nl param (#1068) Stephen Hankinson 2024-01-10 03:46:27 -04:00
2ddce7294e print_grammar to stderr (#1052) Joseph Turian 2024-01-10 02:46:03 -05:00
431cb3ec81 Update llama.cpp Andrei Betlen 2024-01-09 15:32:39 -05:00
1ae05c102b Update llama.cpp Andrei Betlen 2024-01-08 14:51:29 -05:00
142a9e1bc3 Update llama.cpp Andrei Betlen 2024-01-05 16:20:50 -05:00
e1cd61ed91 Fix #1038 Andrei Betlen 2024-01-05 04:57:57 -05:00
b1e996219c Merge branch 'main' into batch-processing Andrei Betlen 2024-01-05 04:09:28 -05:00
75d0527fd7 Bump version v0.2.27 Andrei Betlen 2024-01-04 18:30:12 -05:00
fffcd0181c Update llama.cpp Andrei Betlen 2024-01-04 18:26:00 -05:00
907b9e9d42 Add Saiga chat format. (#1050) Fedor Moiseev 2024-01-05 06:12:58 +07:00
f766b70c9a Fix: Correct typo in README.md (#1058) Caleb Hoff 2024-01-04 17:12:32 -06:00
cf743ec5d3 Added ChatGLM chat format (#1059) xaviviro 2024-01-05 00:12:02 +01:00
eb9c7d4ed8 Update llama.cpp Andrei Betlen 2024-01-03 22:04:04 -05:00
011c3630f5 Bump version v0.2.26 Andrei Betlen 2023-12-27 17:35:02 -05:00
969ea6a2c0 Update llama.cpp Andrei Betlen 2023-12-27 17:33:26 -05:00
f952d45c2c Update llama.cpp Andrei Betlen 2023-12-24 01:34:36 -05:00
f6f157c06d Update bug report instructions for new build process. Andrei Betlen 2023-12-22 15:35:51 -05:00
92284f32cb Add HIP_PATH to dll search directories for windows users. Andrei Betlen 2023-12-22 15:29:56 -05:00
2b0d3f36fa set llama_max_devices using library function Andrei Betlen 2023-12-22 15:19:28 -05:00
d9a1d90fd7 Fix typo Andrei Betlen 2023-12-22 15:12:27 -05:00
37556bf9c4 Bump version v0.2.25 Andrei Betlen 2023-12-22 14:55:58 -05:00
6d8bc090f9 fix: inccorect bindings for kv override. Based on #1011 Andrei Betlen 2023-12-22 14:52:20 -05:00
f4be84c122 Fix typo Andrei Betlen 2023-12-22 14:40:44 -05:00
9b3a5939f3 docs: Add multi-model link to readme Andrei Betlen 2023-12-22 14:40:13 -05:00
522aecb868 docs: add server config docs Andrei Betlen 2023-12-22 14:37:24 -05:00
6473796343 Update llama.cpp Andrei Betlen 2023-12-22 14:10:34 -05:00
15ee2106f6 Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2023-12-22 14:05:26 -05:00
4b01a873ef server: Support none defaulting to infinity for completions (#111) swg 2023-12-22 14:05:13 -05:00
99ff175562 Check if completion_tokens is none in error handler. Andrei Betlen 2023-12-22 13:41:06 -05:00
12b7f2f4e9 [Feat] Multi model support (#931) Dave 2023-12-22 11:51:25 +01:00
4a85442c35 Update llama.cpp Andrei Betlen 2023-12-22 00:12:37 -05:00
2f03fb0231 fix text_offset of multi-token characters (#1037) twaka 2023-12-22 14:03:29 +09:00
33cc623346 Implement openai api compatible authentication (#1010) docmeth02 2023-12-21 19:44:49 +01:00
788394c096 Update llama.cpp Andrei Betlen 2023-12-21 13:16:46 -05:00
ffceb772d1 Update llama.cpp Andrei Betlen 2023-12-19 17:05:40 -05:00
a05b4da80a fix: float32 is not JSON serializable when streaming logits. Andrei Betlen 2023-12-18 18:40:36 -05:00
fcbd177c95 Fix logits are not json serializable Andrei Betlen 2023-12-18 18:38:04 -05:00
a625412a74 Merge branch 'main' into batch-processing Andrei Betlen 2023-12-18 18:37:23 -05:00
abda047284 Update changelog Andrei Betlen 2023-12-18 18:16:17 -05:00
7df6c32544 Fix type annotations Andrei Betlen 2023-12-18 18:14:53 -05:00
b703aad79e Fix type annotation Andrei Betlen 2023-12-18 18:13:37 -05:00
d0aedfcff6 Fix type annotation Andrei Betlen 2023-12-18 18:12:49 -05:00
2993936b10 Fix ctypes definitions of llama_kv_cache_view_update and llama_kv_cache_view_free. (#1028) Eduard Christian Dumitrescu 2023-12-18 18:11:26 -05:00
5e863d8a3b Bump version v0.2.24 Andrei Betlen 2023-12-18 16:09:18 -05:00
cfd698c75c Update low_level_api_llama_cpp.py to match current API (#1023) Jonathan Soma 2023-12-18 15:59:11 -05:00
095c650006 Add offload_kqv option to llama and server Andrei Betlen 2023-12-18 15:36:09 -05:00
472b344ae3 Remove unnused import Andrei Betlen 2023-12-18 15:32:40 -05:00
2fc48c54be Update llama.cpp Andrei Betlen 2023-12-18 15:32:15 -05:00
6b2e0e05b4 perf: Don't convert logprobs arrays to lists (#1021) kddubey 2023-12-18 11:28:12 -08:00
62944df142 Bugfix: Remove f16_kv, add offload_kqv field (#1019) Brandon Roberts 2023-12-18 12:27:11 -07:00
37da8e863a Update README.md functionary demo typo (#996) evelynmitchell 2023-12-16 17:00:30 -07:00
f1c631dc53 Bug fixed with n_ctx=0 (#1015) Daniele Morotti 2023-12-17 00:59:50 +01:00
5a8944672f Fix logits_to_logprobs for 2-D and 3-D logits (#1002) kddubey 2023-12-16 15:59:26 -08:00
534b1ea9b5 Update llama.cpp Andrei Betlen 2023-12-16 18:57:43 -05:00
cbce061ffd Bump version v0.2.23 Andrei Betlen 2023-12-13 21:52:29 -05:00
8b4db732bd Add qwen chat format (#1005) yhfgyyf 2023-12-14 10:43:43 +08:00
690c563b60 Merge branch 'main' of github.com:abetlen/llama_cpp_python into main Andrei Betlen 2023-12-13 21:43:19 -05:00
c0fc0a1e82 Update llama.cpp Andrei Betlen 2023-12-13 21:43:16 -05:00
8e44a32075 Add support for running the server with SSL (#994) Radoslav Gerganov 2023-12-12 03:47:11 +02:00
ef22e478db Replace logits_to_logprobs implementation with numpy equivalent to llama.cpp (#991) Tanner Hobson 2023-12-11 20:46:27 -05:00
ac35f68e4d Fix UnsupportedOperation: fileno in suppress_stdout_stderr (#961) zocainViken 2023-12-12 02:44:51 +01:00
b938cccf05 Add Pygmalion chat format (#986) chiensen 2023-12-12 09:44:04 +08:00
6bbeea07ae README.md multimodal params fix (#967) zocainViken 2023-12-12 02:41:38 +01:00
c1d92ce680 fix minor typo (#958) Aniket Maurya 2023-12-12 01:40:38 +00:00
4335a9db13 Merge branch 'main' into batch-processing Andrei Betlen 2023-12-11 19:46:59 -05:00
e9bc4c4baf Fix docker build Andrei Betlen 2023-12-11 10:39:51 -05:00
c1e73e73a3 Bump version v0.2.22 Andrei Betlen 2023-12-11 10:26:42 -05:00
ec26f364cc Remove f16_kv Andrei Betlen 2023-12-11 10:25:37 -05:00

... 7 8 9 10 11 ...