CrossEncoder based on jinaai/jina-reranker-v2-base-multilingual

This is a Cross Encoder model finetuned from jinaai/jina-reranker-v2-base-multilingual using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.

Model Details

Model Description

Model Sources

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("cuadron11/jina-reranker-v2-base-multilingual-contrastive-berria")
# Get scores for pairs of texts
pairs = [
    ['Zein dira Euskal Eskola Publikoaren kanpainaren alde agertu diren pertsonaia ezagunak?', '«Askotarikoa eta inklusiboa»\n\nEskola publikoaren bestelako ezaugarriak ere aletu dituzte plataformako kideek: haien esanetan, eskola publikoa «askotarikoa, inklusiboa, herritarra, parte hartzailea, berritzailea eta jasangarria» da, «begirada feminista» du, eta «elkartasunerako, elkarbizitzarako eta elkar zaintzeko gunea» eskaintzen du.\n\nAgerraldian, Garbiñe Biurrun epaileak eta Unai Mendizabal bertsolariak babesa eman diote kanpainari. Beste lagun ezagun ugarik ere bat egin dute eskola publikoaren aldeko aldarriarekin: Katixa Agirre, Jon Arretxe eta Txani Rodriguez idazleek, La Basu, Yogurinha Borova eta Olatz Salvador kantari eta musikariek, Xabier Euzkitze, Kepa Iribar eta Maitane Urbieta kazetariek, Oihana Iguaran eta Aner Peritz Euzkitze bertsolariek, Sara Cozar, Aitziber Garmendia, Irantzu Mantxo, Asier Zinkunegi eta Asier Hernandez aktoreek eta abarrek.'],
    ['Zeintzuk izan ziren autobus istripua eragin zuten arrazoiak?', 'Gidariaren defentsak bi arrazoitan oinarritu zuen helegitea: bata, haren iritziz, zuhurtziagabekeria ez zela larria; bestea, zigortzeko erabilitako frogek ez dutela erakusten istripua gidariak eragin zuenik. Lehen argudioa atzera bota dute, jurisprudentzian oinarrituta. Bigarrena atzera botatzeko bat egin dute auzialdiko epaiarekin. Epai haren arabera, hiru arrazoik eragin zuten istripua: gidariak abiadura moteldu beharrean azkartu egin zuela; ez zuela erabili ez esku balaztarik eta ez ibilgailua geratzeko beste bitartekorik; eta ez zuela behar besteko arretaz gidatu. Epaiketan, adituen txostenek baztertu egin zuten autobusaren balaztatze sistemak akatsen bat zuela. Epailearen esanetan, «autobusa geratzeko moduak bazeuden, baina gidariak ez zituen erabili, ez zuen jakin egoerari aurre egiten».'],
    ['Non zegoen Carles Puigdemont Kataluniako Generalitateko presidente ohia atzo arratsaldean?', 'Puigdemontek «sorgin ehiza» salatu du, eta ukatu egin du bere burua entregatzeko asmoa zuela\n\n«Waterloon nago gaur, egun biziki zailen ondoren». Hala erantzun dio batek baino gehiagok egindako galderari, atzo Carles Puigdemont Generalitateko presidente ohiak Bartzelonako Ziudadela parkean bost minutuko agerraldia egin eta desagertu ondoren. X sare sozialean mezu luze bezain sakona zabaldu du. Haren lehen hitzak, atzo Bartzelonako Ziudadela parketik joan zenetik. Inor gutxik espero zuen beste behin ere ihes egingo zuenik zazpi urteko erbestealdia amaitu ostean. Salvador Illaren inbestidura saioan bertan izango zela iragarri zuen aurreko egunetan; ez zen, ordea, hala izan.\n\nPuigdemontek berretsi du «inoiz» ez duela izan bere burua entregatzeko borondatea, ezta bere atxiloketa erraztekoa ere: «Onartezina iruditzen zait arrazoi politikoengatik nire atzetik ibiltzea eta, gainera, amnistia legea ez aplikatzea». Argi utzi du, ordea, Katalunian izan den tarte laburrean ez duela izan ezkutatzen aritzeko asmorik: «[Elenak eta Barne Kontseiluak] dagokidan bizkartzaina eman izan balidate, une oro jakingo zuketen zein zen nire ibilbidea Bartzelonan eta Katalunian zehar. Atzoko operazio eldarniotsua ez zen beharrezkoa izango, eta haren biografia publikoaren parte izango da betiko. Eta ez meritu gisa, hain zuzen».\n\nGaur goizean, Puigdemont erbestean dela esan du Gonzalo Boye haren abokatuak, Catalunya Radion eman duen elkarrizketan; Jordi Turull Junts Per Catalunyako idazkari nagusiak, berriz, goizean zehaztu du Ipar Katalunian lo egin duela, eta Waterloon zegoela jada. Mossoek, beren partetik, ez diete jaramonik egin bi ordezkarien adierazpenei, eta Puigdemonten arrastoaren atzetik ibili dira Katalunian bertan.'],
    ['Zer dio Espainiako Kultura Ministerioaren Adimen artifizialaren praktika onen gidak adimen artifizialaren erabilerari buruz?', '«Sorkuntza sintetikoa artelan lauak ari da bultzatzen, eta horrek hezur haragizko sortzaileen obran ere badu eragina, gainera». Haren esanetan, gero eta ekoizle gehiago ari zaizkie artistei eskatzen haien izaerak ez daitezela gehiegi antzeman lanetan, «beren estiloak ez dezan molestatu». Musika lanei buruz ari delarik bota du esaldia LeGardonek, baina argitu du edozein arte diziplinatan gertatzen dela antzera. Dioenez, enpresa handiek gero eta artelan «homogeneoagoak» nahiko dituztenez, «pertsonalitaterik gabeak», azkenerako lortuko dute herritarren gustuak «modelatzea», eta, hortaz, inolako trabarik gabe egiten ahalko dizkiete enkargu guztiak adimen artifizialari, artista premiarik eduki gabe batere.\n\nMugak erren\n\nEspainiako Kultura Ministerioak Adimen artifizialaren praktika onen gida plazaratu du aurten, erabilerari buruzko aholkuak emateko. Eta, horretan, zehaztu du soilik «laguntza» bezala erabil daitekeela AA sorkuntzetan, eta ez «gizaki baten ahala eta lanaren ordezko bezala». Espainiako Gobernuak argitalpen hori egin bezain pronto, honakoa idatzi zuen Expraik sarean: «Alegia, lapurtzen ahal zaigu, baina gutxi?». Ez du posible ikusten AA erabiltzea tartean lapurretarik egin gabe, dioenez teknologiak beti baliatzen dituelako aurrez egindako lanak. «Erabilera hasieratik dago kutsatua».'],
    ['Zenbat langile kaleratu zituen Imaginariumek 2020an?', 'Urteak zeramatzan erdipurdi. Garairik loriatsuenetan 800 langile ere izan zituen Zaragozan (Espainia) sortutako enpresak, eta urtean ehun milioi euro inguru fakturatu zituen 2013 eta 2015 artean. Burtsara 2009. urtean egin zuen jauzi. 420 denda izan zituen hogei herrialdetan banatuta, baina, 2021. urtetik, bi soilik zeuden irekita: Zaragozan bata eta Malagan (Espainia) bestea.\n\nA zer erorikoa!\n\nSekulakoa. 2018. urtean erdira murriztu zuen fakturazioa, 49 milioi eurora, eta 2019an 30 milioira. COVID-19aren urtean, 2020an, galerak hamahiru milioi eurorenak izan ziren, eta 144 langiletik 110 kaleratu zituzten. 32 urteko ibilbideaaren ostean, ezin izan dio aurre egin konpetentziari.\n\nEta zein da, ba, halako konpetentzia?\n\nBegi bistakoa da erantzuna: Amazon eta enparauak. Internet bidez diharduten erraldoiek dituzten prezioekin lehiatu ezinda dabiltza Toys’R’Us eta Poly jostailu dendak ere. Azken horrek abian jarri du Espainian dituen 186 langileak kaleratzeko prozedura.\n\nEz dira garai onak sektorearentzat.\n\nEz dira, ez. Imaginariumen azken jabeak, Teal Group Holdingsek, aitortu du jostailu denden negozioa ez dela bideragarria.\n\nOrduan, atzeko atetik irten da Imaginarium?\n\nAtzeko ate txikitik, bai.'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5,)

# Or rank different texts based on similarity to a single text
ranks = model.rank(
    'Zein dira Euskal Eskola Publikoaren kanpainaren alde agertu diren pertsonaia ezagunak?',
    [
        '«Askotarikoa eta inklusiboa»\n\nEskola publikoaren bestelako ezaugarriak ere aletu dituzte plataformako kideek: haien esanetan, eskola publikoa «askotarikoa, inklusiboa, herritarra, parte hartzailea, berritzailea eta jasangarria» da, «begirada feminista» du, eta «elkartasunerako, elkarbizitzarako eta elkar zaintzeko gunea» eskaintzen du.\n\nAgerraldian, Garbiñe Biurrun epaileak eta Unai Mendizabal bertsolariak babesa eman diote kanpainari. Beste lagun ezagun ugarik ere bat egin dute eskola publikoaren aldeko aldarriarekin: Katixa Agirre, Jon Arretxe eta Txani Rodriguez idazleek, La Basu, Yogurinha Borova eta Olatz Salvador kantari eta musikariek, Xabier Euzkitze, Kepa Iribar eta Maitane Urbieta kazetariek, Oihana Iguaran eta Aner Peritz Euzkitze bertsolariek, Sara Cozar, Aitziber Garmendia, Irantzu Mantxo, Asier Zinkunegi eta Asier Hernandez aktoreek eta abarrek.',
        'Gidariaren defentsak bi arrazoitan oinarritu zuen helegitea: bata, haren iritziz, zuhurtziagabekeria ez zela larria; bestea, zigortzeko erabilitako frogek ez dutela erakusten istripua gidariak eragin zuenik. Lehen argudioa atzera bota dute, jurisprudentzian oinarrituta. Bigarrena atzera botatzeko bat egin dute auzialdiko epaiarekin. Epai haren arabera, hiru arrazoik eragin zuten istripua: gidariak abiadura moteldu beharrean azkartu egin zuela; ez zuela erabili ez esku balaztarik eta ez ibilgailua geratzeko beste bitartekorik; eta ez zuela behar besteko arretaz gidatu. Epaiketan, adituen txostenek baztertu egin zuten autobusaren balaztatze sistemak akatsen bat zuela. Epailearen esanetan, «autobusa geratzeko moduak bazeuden, baina gidariak ez zituen erabili, ez zuen jakin egoerari aurre egiten».',
        'Puigdemontek «sorgin ehiza» salatu du, eta ukatu egin du bere burua entregatzeko asmoa zuela\n\n«Waterloon nago gaur, egun biziki zailen ondoren». Hala erantzun dio batek baino gehiagok egindako galderari, atzo Carles Puigdemont Generalitateko presidente ohiak Bartzelonako Ziudadela parkean bost minutuko agerraldia egin eta desagertu ondoren. X sare sozialean mezu luze bezain sakona zabaldu du. Haren lehen hitzak, atzo Bartzelonako Ziudadela parketik joan zenetik. Inor gutxik espero zuen beste behin ere ihes egingo zuenik zazpi urteko erbestealdia amaitu ostean. Salvador Illaren inbestidura saioan bertan izango zela iragarri zuen aurreko egunetan; ez zen, ordea, hala izan.\n\nPuigdemontek berretsi du «inoiz» ez duela izan bere burua entregatzeko borondatea, ezta bere atxiloketa erraztekoa ere: «Onartezina iruditzen zait arrazoi politikoengatik nire atzetik ibiltzea eta, gainera, amnistia legea ez aplikatzea». Argi utzi du, ordea, Katalunian izan den tarte laburrean ez duela izan ezkutatzen aritzeko asmorik: «[Elenak eta Barne Kontseiluak] dagokidan bizkartzaina eman izan balidate, une oro jakingo zuketen zein zen nire ibilbidea Bartzelonan eta Katalunian zehar. Atzoko operazio eldarniotsua ez zen beharrezkoa izango, eta haren biografia publikoaren parte izango da betiko. Eta ez meritu gisa, hain zuzen».\n\nGaur goizean, Puigdemont erbestean dela esan du Gonzalo Boye haren abokatuak, Catalunya Radion eman duen elkarrizketan; Jordi Turull Junts Per Catalunyako idazkari nagusiak, berriz, goizean zehaztu du Ipar Katalunian lo egin duela, eta Waterloon zegoela jada. Mossoek, beren partetik, ez diete jaramonik egin bi ordezkarien adierazpenei, eta Puigdemonten arrastoaren atzetik ibili dira Katalunian bertan.',
        '«Sorkuntza sintetikoa artelan lauak ari da bultzatzen, eta horrek hezur haragizko sortzaileen obran ere badu eragina, gainera». Haren esanetan, gero eta ekoizle gehiago ari zaizkie artistei eskatzen haien izaerak ez daitezela gehiegi antzeman lanetan, «beren estiloak ez dezan molestatu». Musika lanei buruz ari delarik bota du esaldia LeGardonek, baina argitu du edozein arte diziplinatan gertatzen dela antzera. Dioenez, enpresa handiek gero eta artelan «homogeneoagoak» nahiko dituztenez, «pertsonalitaterik gabeak», azkenerako lortuko dute herritarren gustuak «modelatzea», eta, hortaz, inolako trabarik gabe egiten ahalko dizkiete enkargu guztiak adimen artifizialari, artista premiarik eduki gabe batere.\n\nMugak erren\n\nEspainiako Kultura Ministerioak Adimen artifizialaren praktika onen gida plazaratu du aurten, erabilerari buruzko aholkuak emateko. Eta, horretan, zehaztu du soilik «laguntza» bezala erabil daitekeela AA sorkuntzetan, eta ez «gizaki baten ahala eta lanaren ordezko bezala». Espainiako Gobernuak argitalpen hori egin bezain pronto, honakoa idatzi zuen Expraik sarean: «Alegia, lapurtzen ahal zaigu, baina gutxi?». Ez du posible ikusten AA erabiltzea tartean lapurretarik egin gabe, dioenez teknologiak beti baliatzen dituelako aurrez egindako lanak. «Erabilera hasieratik dago kutsatua».',
        'Urteak zeramatzan erdipurdi. Garairik loriatsuenetan 800 langile ere izan zituen Zaragozan (Espainia) sortutako enpresak, eta urtean ehun milioi euro inguru fakturatu zituen 2013 eta 2015 artean. Burtsara 2009. urtean egin zuen jauzi. 420 denda izan zituen hogei herrialdetan banatuta, baina, 2021. urtetik, bi soilik zeuden irekita: Zaragozan bata eta Malagan (Espainia) bestea.\n\nA zer erorikoa!\n\nSekulakoa. 2018. urtean erdira murriztu zuen fakturazioa, 49 milioi eurora, eta 2019an 30 milioira. COVID-19aren urtean, 2020an, galerak hamahiru milioi eurorenak izan ziren, eta 144 langiletik 110 kaleratu zituzten. 32 urteko ibilbideaaren ostean, ezin izan dio aurre egin konpetentziari.\n\nEta zein da, ba, halako konpetentzia?\n\nBegi bistakoa da erantzuna: Amazon eta enparauak. Internet bidez diharduten erraldoiek dituzten prezioekin lehiatu ezinda dabiltza Toys’R’Us eta Poly jostailu dendak ere. Azken horrek abian jarri du Espainian dituen 186 langileak kaleratzeko prozedura.\n\nEz dira garai onak sektorearentzat.\n\nEz dira, ez. Imaginariumen azken jabeak, Teal Group Holdingsek, aitortu du jostailu denden negozioa ez dela bideragarria.\n\nOrduan, atzeko atetik irten da Imaginarium?\n\nAtzeko ate txikitik, bai.',
    ]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]

Evaluation

Metrics

Cross Encoder Reranking

  • Dataset: jina-reranker-v2-base-multilingual-contrastive-berria
  • Evaluated with CrossEncoderRerankingEvaluator with these parameters:
    {
        "at_k": 10,
        "always_rerank_positives": false
    }
    
Metric Value
map 0.0037 (+0.0032)
mrr@10 0.0037 (+0.0032)
ndcg@10 0.0037 (+0.0029)

Training Details

Training Dataset

Unnamed Dataset

  • Size: 6,400 training samples
  • Columns: query and positive
  • Approximate statistics based on the first 1000 samples:
    query positive
    type string string
    details
    • min: 20 characters
    • mean: 76.62 characters
    • max: 162 characters
    • min: 383 characters
    • mean: 1496.97 characters
    • max: 2131 characters
  • Samples:
    query positive
    Zenbat diru ordaindu beharko dute atzerritarrek AEBetako urrezko txartela erosteko? Immigranteak AEBetan

    Bost milioi dolarreko ongietorria

    Etorkin batzuk ez ditu nahi, baina beste batzuk bai. Donald Trumpek iragarri du ‘urrezko txartela’ emango dietela atzerritar aberatsei: bost milioi ordainduz gero, estatubatuar herritartasuna lortzeko bidea eman nahi die munduko dirudunei.

    Etorkin batzuk ongi etorriak dira Donald Trumpen administrazioarentzat. Haren beste ideia biribil horietako bat da: bost milioi dolarreko urrezko txartela erostearen truke, AEBetan bizitzeko baimen iraunkorra izango dute, eta herritartasuna lortzeko bidea.

    Orain arte EB-5 programak betetzen zuen AEBetako urrezko bisaren egitekoa: bizileku baimena ematea eta herritartasuna lortzeko erraztasunak eskaintzea. EB-5 bisa lortzeko, berriz, lanpostuak sortuko dituen inbertsioa egitea eskatzen zaie atzerritarrei, 1,05 milioi dolarrekoa —800.000 dolar zenbait tokitan— .

    Trumpen urrezko txartelak, ordea, ez du inbertsiorik eskatzen, ezta etxebizitzak erostea eskatzen ere, beste herrialde batzuetan egit...
    Zein urtetan amaitu zen Israelen eta Libanoren arteko gerra? «Jakina da [Israel] Hezbollahko buruzagien aurka ari dela, baina herrialde independente baten subiranotasuna urratzen ari dira»

    JOSEP BORRELLEBko diplomaziaburua

    Ebazpen horrek Israelen eta Libanoren arteko 2006ko gerraren amaiera ekarri zuen. Haren arabera, inolako talde armatu ezin da egon Libano hegoaldean —Litani ibaiaren eta Israelgo mugaren artean—; soilik, bakea mantentzeko lanetan diharduten Libanoko armadak eta Unifil NBEren Libanorako misioak jardun dezakete bertan. Hezbollahk ez duela ebazpenak dioena betetzen, hori argudiatuz justifikatu du Daniel Hagari Israelgo armadako bozeramaileak gaur hasi duten lurreko erasoaldia. Eraso horrekin, ordea, Tel Avivek urratu egin du NBEren ebazpenak dioena.

    Ez soilik Libanon

    Israelgo armadak Libanotik kanpo ere jarraitzen du erasoan. Gaur, Israelgo soldaduek tiroz hil dituzte bi lagun Zisjordaniako Nablus hirian. Palestinako Osasun Ministerioak eman du gertaeraren berri. Bestalde, Siriako Berri Agentzia Nazionalak jakinarazi du hiru ...
    Zer gertatu zen joan den ostiralean Zuzenbide Fakultatean irakaslearen eta ikasleen artean? EHUk prozedura abiatu du mezu matxistak eta arrazistak zabaldu dituen irakaslea lanpostutik kentzeko

    EHUko Berdintasun Zuzendaritzak atzo jakinarazi zuen indarkeria matxistaren aurkako prozedura abiatuko zuela sare sozialetan mezu «arrazistak, klasistak eta matxistak» egin dituen irakaslearen aurka. Kautelazko neurri gisa, adierazi zuten irakasleak ez duela irakaskuntza lanik egingo prozesua amaitu arte. Oraingoan, pauso bat gehiago eman du unibertsitateak: martxan jarri du gizon hori gaur egun betetzen ari den ordezko irakasle lanpostutik kentzeko prozedura.

    Azken asteetan, ikasleek kexen bidez eskatu diote EHUri Lanaren eta Gizarte Segurantzaren Zuzenbide I ikasgaiko ordezko irakaslea kanporatzeko. Joan den ostegunean hasi ziren ikasleen protestak. Irakasleak argitaratutako mezuen berri eman zuen Ernai gazte antolakundeak, eta salatu zuen EHUk ikasturte honetarako «irakasle faxista bat» kontratatu duela.

    Hori salatzeko protesta bat egin zuten ikasleek astelehenean, Leioan (Bizkaia...
  • Loss: CachedMultipleNegativesRankingLoss with these parameters:
    {
        "scale": 10.0,
        "num_negatives": null,
        "activation_fn": "torch.nn.modules.activation.Sigmoid",
        "mini_batch_size": 16
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 1,600 evaluation samples
  • Columns: query and positive
  • Approximate statistics based on the first 1000 samples:
    query positive
    type string string
    details
    • min: 24 characters
    • mean: 77.89 characters
    • max: 175 characters
    • min: 363 characters
    • mean: 1516.31 characters
    • max: 2222 characters
  • Samples:
    query positive
    Zein dira Euskal Eskola Publikoaren kanpainaren alde agertu diren pertsonaia ezagunak? «Askotarikoa eta inklusiboa»

    Eskola publikoaren bestelako ezaugarriak ere aletu dituzte plataformako kideek: haien esanetan, eskola publikoa «askotarikoa, inklusiboa, herritarra, parte hartzailea, berritzailea eta jasangarria» da, «begirada feminista» du, eta «elkartasunerako, elkarbizitzarako eta elkar zaintzeko gunea» eskaintzen du.

    Agerraldian, Garbiñe Biurrun epaileak eta Unai Mendizabal bertsolariak babesa eman diote kanpainari. Beste lagun ezagun ugarik ere bat egin dute eskola publikoaren aldeko aldarriarekin: Katixa Agirre, Jon Arretxe eta Txani Rodriguez idazleek, La Basu, Yogurinha Borova eta Olatz Salvador kantari eta musikariek, Xabier Euzkitze, Kepa Iribar eta Maitane Urbieta kazetariek, Oihana Iguaran eta Aner Peritz Euzkitze bertsolariek, Sara Cozar, Aitziber Garmendia, Irantzu Mantxo, Asier Zinkunegi eta Asier Hernandez aktoreek eta abarrek.
    Zeintzuk izan ziren autobus istripua eragin zuten arrazoiak? Gidariaren defentsak bi arrazoitan oinarritu zuen helegitea: bata, haren iritziz, zuhurtziagabekeria ez zela larria; bestea, zigortzeko erabilitako frogek ez dutela erakusten istripua gidariak eragin zuenik. Lehen argudioa atzera bota dute, jurisprudentzian oinarrituta. Bigarrena atzera botatzeko bat egin dute auzialdiko epaiarekin. Epai haren arabera, hiru arrazoik eragin zuten istripua: gidariak abiadura moteldu beharrean azkartu egin zuela; ez zuela erabili ez esku balaztarik eta ez ibilgailua geratzeko beste bitartekorik; eta ez zuela behar besteko arretaz gidatu. Epaiketan, adituen txostenek baztertu egin zuten autobusaren balaztatze sistemak akatsen bat zuela. Epailearen esanetan, «autobusa geratzeko moduak bazeuden, baina gidariak ez zituen erabili, ez zuen jakin egoerari aurre egiten».
    Non zegoen Carles Puigdemont Kataluniako Generalitateko presidente ohia atzo arratsaldean? Puigdemontek «sorgin ehiza» salatu du, eta ukatu egin du bere burua entregatzeko asmoa zuela

    «Waterloon nago gaur, egun biziki zailen ondoren». Hala erantzun dio batek baino gehiagok egindako galderari, atzo Carles Puigdemont Generalitateko presidente ohiak Bartzelonako Ziudadela parkean bost minutuko agerraldia egin eta desagertu ondoren. X sare sozialean mezu luze bezain sakona zabaldu du. Haren lehen hitzak, atzo Bartzelonako Ziudadela parketik joan zenetik. Inor gutxik espero zuen beste behin ere ihes egingo zuenik zazpi urteko erbestealdia amaitu ostean. Salvador Illaren inbestidura saioan bertan izango zela iragarri zuen aurreko egunetan; ez zen, ordea, hala izan.

    Puigdemontek berretsi du «inoiz» ez duela izan bere burua entregatzeko borondatea, ezta bere atxiloketa erraztekoa ere: «Onartezina iruditzen zait arrazoi politikoengatik nire atzetik ibiltzea eta, gainera, amnistia legea ez aplikatzea». Argi utzi du, ordea, Katalunian izan den tarte laburrean ez duela izan ezkutatzen...
  • Loss: CachedMultipleNegativesRankingLoss with these parameters:
    {
        "scale": 10.0,
        "num_negatives": null,
        "activation_fn": "torch.nn.modules.activation.Sigmoid",
        "mini_batch_size": 16
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • learning_rate: 2e-05
  • warmup_ratio: 0.1
  • load_best_model_at_end: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss Validation Loss jina-reranker-v2-base-multilingual-contrastive-berria_ndcg@10
0.5 200 0.0439 0.0186 0.0037 (+0.0029)
1.0 400 0.02 0.0177 0.0037 (+0.0029)
1.5 600 0.0152 0.0177 0.0037 (+0.0029)
2.0 800 0.015 0.0179 0.0037 (+0.0029)
2.5 1000 0.0135 0.0180 0.0037 (+0.0029)
3.0 1200 0.0139 0.0179 0.0037 (+0.0029)
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.9.7
  • Sentence Transformers: 5.0.0
  • Transformers: 4.56.0
  • PyTorch: 2.7.1+cu126
  • Accelerate: 1.5.2
  • Datasets: 4.0.0
  • Tokenizers: 0.22.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
Downloads last month
4
Safetensors
Model size
0.3B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for cuadron11/jina-reranker-v2-base-multilingual-contrastive-berria

Finetuned
(26)
this model

Paper for cuadron11/jina-reranker-v2-base-multilingual-contrastive-berria

Evaluation results

  • Map on jina reranker v2 base multilingual contrastive berria
    self-reported
    0.004
  • Mrr@10 on jina reranker v2 base multilingual contrastive berria
    self-reported
    0.004
  • Ndcg@10 on jina reranker v2 base multilingual contrastive berria
    self-reported
    0.004