Distiluse Multilingual

Text model for computing sentence embeddings in multiple languages based on Sentence-Transformers framework¹.

Pre-trained models

Multilingual model for semantic similarity

Parameters:

Name	Type	Description	Default
`device`	`torch.device, Optional`	The PyTorch device to initialise the model weights. Defaults to `torch.device("cpu")`.	required
`enable_tokenizer_truncation`	`bool, Optional`	Enable positional embeddings truncation with strategy `only_first`. Defaults to `False`.	required

This model is an implementation of a TorchModel.

Multilingual model for semantic similarity

Parameters:

Name	Type	Description	Default
`device`	`torch.device`	The PyTorch device to initialise the model weights. Defaults to `torch.device("cpu")`.	`device(type='cpu')`
`enable_tokenizer_truncation`	`bool`	Enable positional embeddings truncation with strategy `only_first`. Defaults to `False`.	`False`

Loads weights from SBERT's hugging face

Nils Reimers and Iryna Gurevych. Making monolingual sentence embeddings multilingual using knowledge distillation. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing. Association for Computational Linguistics, 11 2020. URL: https://arxiv.org/abs/2004.09813. ↩