elasticsearch 8.2 版本批量化数据写入

时间:2024-10-10 07:16:35

'error': {'type': 'mapper_parsing_exception', 'reason': 'failed to parse', 'caused_by': {'type': 'illegal_argument_exception', 'reason': 'The [dot_product] similarity can only be used with unit-length vectors. Preview of invalid vector:

这个错误信息表明你在使用 `dot_product` 相似度时,向量不是单位长度的。`dot_product` 相似度要求向量必须是单位长度的(即向量的 L2 范数为 1)。

### 解决方法

你需要在插入数据之前,将向量归一化为单位长度。可以使用 NumPy 库来实现这一点。

### 安装依赖
首先,确保你已经安装了 `elasticsearch` 和 `numpy` 库:

```bash
pip install elasticsearch numpy
```

### Python 代码示例(多线程,向量归一化)

```python
fr