Proceedings of the 31st International Conference on Computational Linguistics, COLING 2025, Abu Dhabi, UAE, January 19-24, 2025

researchr

You are not signed in
Sign in
Sign up

Owen Rambow, Leo Wanner, Marianna Apidianaki, Hend Al-Khalifa 0001, Barbara Di Eugenio, Steven Schockaert, editors, Proceedings of the 31st International Conference on Computational Linguistics, COLING 2025, Abu Dhabi, UAE, January 19-24, 2025. Association for Computational Linguistics, 2025. [doi]

Conference: COLING2025

Abstract is missing.

Frontmatter [doi]

PreAct: Prediction Enhances Agent's Planning AbilityDayuan Fu, Jianzhao Huang, Siyuan Lu, Guanting Dong, Yejie Wang, Keqing He 0001, Weiran Xu. 1-16 [doi]

The PRECOM-SM Corpus: Gambling in Spanish Social MediaPablo Álvarez-Ojeda, Maria Victoria Cantero Romero, Anastasia Semikozova, Arturo Montejo Ráez. 17-28 [doi]

How Well Can a Long Sequence Model Model Long Sequences? Comparing Architectural Inductive Biases on Long-Context AbilitiesJerry Huang. 29-39 [doi]

Sequential Fusion of Text-close and Text-far Representations for Multimodal Sentiment AnalysisKaiwei Sun, Mi Tian 0007. 40-49 [doi]

PoemBERT: A Dynamic Masking Content and Ratio Based Semantic Language Model For Chinese Poem GenerationChihan Huang, Xiaobo Shen 0001. 50-60 [doi]

CDA⌃2: Counterfactual Diffusion Augmentation for Cross-Domain Adaptation in Low-Resource Sentiment AnalysisDancheng Xin, Kaiqi Zhao 0001, Jingyun Sun, Yang Li. 61-72 [doi]

CodeJudge-Eval: Can Large Language Models be Good Judges in Code Understanding?Yuwei Zhao, Ziyang Luo, Yuchen Tian, Hongzhan Lin 0001, Weixiang Yan, Annan Li, Jing Ma 0004. 73-95 [doi]

Match, Compare, or Select? An Investigation of Large Language Models for Entity MatchingTianshu Wang, Xiaoyang Chen, Hongyu Lin, Xuanang Chen, Xianpei Han, Le Sun 0001, Hao Wang, Zhenyu Zeng. 96-109 [doi]

InstructGEC: Enhancing Unsupervised Grammatical Error Correction with Instruction TuningJiayi Deng, Chen Chen 0012, Chunyan Hou, Xiaojie Yuan. 110-122 [doi]

Sibyl: Empowering Empathetic Dialogue Generation in Large Language Models via Sensible and Visionary Commonsense InferenceLanrui Wang, Jiangnan Li, Chenxu Yang, Zheng Lin 0001, Hongyin Tang, Huan Liu, Yanan Cao, Jingang Wang, Weiping Wang 0005. 123-140 [doi]

Noise-powered Multi-modal Knowledge Graph Representation FrameworkZhuo Chen 0007, Yin Fang, Yichi Zhang 0009, Lingbing Guo, Jiaoyan Chen 0001, Jeff Z. Pan, Huajun Chen, Wen Zhang 0015. 141-155 [doi]

ToolEyes: Fine-Grained Evaluation for Tool Learning Capabilities of Large Language Models in Real-world ScenariosJunjie Ye, Guanyu Li, Songyang Gao, Caishuang Huang, Yilong Wu, Sixian Li, Xiaoran Fan, Shihan Dou, Tao Ji, Qi Zhang 0001, Tao Gui, Xuanjing Huang 0001. 156-187 [doi]

Federated Incremental Named Entity RecognitionZesheng Liu, Qiannan Zhu, Cuiping Li 0001, Hong Chen 0001. 188-198 [doi]

Large Language Models are Good Annotators for Type-aware Data Augmentation in Grammatical Error CorrectionXinyuan Li, Yunshi Lan. 199-213 [doi]

Looks can be Deceptive: Distinguishing Repetition Disfluency from ReduplicationArif Ahmad, Mothika Gayathri Khyathi, Pushpak Bhattacharyya. 214-229 [doi]

Learning to Verify Summary Facts with Fine-Grained LLM FeedbackJihwan Oh, Jeonghwan Choi, Nicole Hee-Yeon Kim, Taewon Yun, Hwanjun Song. 230-242 [doi]

FedMKT: Federated Mutual Knowledge Transfer for Large and Small Language ModelsTao Fan, Guoqiang Ma, Yan Kang 0001, Hanlin Gu, Yuanfeng Song, Lixin Fan, Kai Chen 0005, Qiang Yang 0001. 243-255 [doi]

Dynamic Graph Neural ODE Network for Multi-modal Emotion Recognition in ConversationYuntao Shou, Tao Meng, Wei Ai 0001, Keqin Li 0001. 256-268 [doi]

HGCLIP: Exploring Vision-Language Models with Graph Representations for Hierarchical UnderstandingPeng Xia, Xingtong Yu, Ming Hu, Lie Ju, Zhiyong Wang 0001, Peibo Duan, ZongYuan Ge. 269-280 [doi]

Persona-DB: Efficient Large Language Model Personalization for Response Prediction with Collaborative Data RefinementChenkai Sun, Ke Yang, Revanth Gangi Reddy, Yi Ren Fung 0001, Hou Pong Chan, Kevin Small, ChengXiang Zhai, Heng Ji. 281-296 [doi]

Style Over Substance: Evaluation Biases for Large Language ModelsMinghao Wu, Alham Fikri Aji. 297-312 [doi]

Multimodal Aspect-Based Sentiment Analysis under Conditional RelationXinjing Liu, Ruifan Li, Shuqin Ye, Guangwei Zhang, Xiaojie Wang 0006. 313-323 [doi]

Semantic Role Labeling of NomBank PartitivesAdam Meyers, Advait Pravin Savant, John E. Ortega. 324-336 [doi]

MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL GenerationDongjun Lee, Choongwon Park, Jaehyuk Kim, Heesoo Park. 337-353 [doi]

InstructMol: Multi-Modal Integration for Building a Versatile and Reliable Molecular Assistant in Drug DiscoveryHe Cao, Zijing Liu, Xingyu Lu, Yuan Yao, Yu Li. 354-379 [doi]

Ambiguity-aware Multi-level Incongruity Fusion Network for Multi-Modal Sarcasm DetectionKuntao Li, Yifan Chen, Qiaofeng Wu, Weixing Mai, Fenghuan Li, Yun Xue. 380-391 [doi]

AdminSet and AdminBERT: a Dataset and a Pre-trained Language Model to Explore the Unstructured Maze of French Administrative DocumentsThomas Sebbag, Solen Quiniou, Nicolas Stucky, Emmanuel Morin. 392-406 [doi]

ELITR-Bench: A Meeting Assistant Benchmark for Long-Context Language ModelsThibaut Thonet, Laurent Besacier, Jos Rozen. 407-428 [doi]

Positive Text Reframing under Multi-strategy OptimizationShutong Jia, Biwei Cao, Qingqing Gao, Jiuxin Cao, Bo Liu. 429-447 [doi]

RAM2C: A Liberal Arts Educational Chatbot based on Retrieval-augmented Multi-role Multi-expert CollaborationHaoyu Huang, Tong Niu, Rui Yang, Luping Shi. 448-458 [doi]

SURE: Mutually Visible Objects and Self-generated Candidate Labels For Relation ExtractionYuxuan Feng, Qian Chen 0023, Qianyou Wu, Xin Guo, Suge Wang. 459-468 [doi]

TransMI: A Framework to Create Strong Baselines from Multilingual Pretrained Language Models for Transliterated DataYihong Liu, Chunlan Ma, Haotian Ye, Hinrich Schütze. 469-495 [doi]

Two-stage Incomplete Utterance Rewriting on Editing OperationZhiyu Cao, Peifeng Li, Qiaoming Zhu, Yaxin Fan. 496-507 [doi]

QuickLLaMA: Query-aware Inference Acceleration for Large Language ModelsJingyao Li, Han Shi, Sitong Wu, Chuanyang Zheng, Zhenguo Li, Xin Jiang, Hong Xu 0001, Jiaya Jia. 508-528 [doi]

SVD-GCL: A Noise-Augmented Hybrid Graph Contrastive Learning Framework for RecommendationLiping Wang, Shichao Li 0007, Hui Wang, Yuyan Gao, Mingyao Wei. 529-539 [doi]

MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQLBing Wang, Changyu Ren, Jian Yang 0030, Xinnian Liang, Jiaqi Bai, Linzheng Chai, Zhao Yan, Qian-Wen Zhang, Di Yin, Xing Sun, Zhoujun Li 0001. 540-557 [doi]

Exploring Concept Depth: How Large Language Models Acquire Knowledge and Concept at Different Layers?Mingyu Jin, Qinkai Yu, Jingyuan Huang, Qingcheng Zeng, Zhenting Wang, Wenyue Hua, Haiyan Zhao 0003, Kai Mei, Yanda Meng, Kaize Ding, Fan Yang 0023, Mengnan Du, Yongfeng Zhang. 558-573 [doi]

Knowledge Graph Entity Typing with Curriculum Contrastive LearningHao Wang, Minghua Nuo, Shan Jiang. 574-583 [doi]

The Dark Side of Function Calling: Pathways to Jailbreaking Large Language ModelsZihui Wu, Haichang Gao, Jianping He 0008, Ping Wang 0003. 584-592 [doi]

Adapters Selector: Cross-domains and Multi-tasks LoRA Modules Integration Usage MethodYiMin Tian, Bolin Zhang, Zhiying Tu, Dianhui Chu. 593-605 [doi]

XFormParser: A Simple and Effective Multimodal Multilingual Semi-structured Form ParserXianfu Cheng, Hang Zhang, Jian Yang, Xiang Li, Weixiao Zhou, Fei Liu, Kui Wu, Xiangyuan Guan, Tao Sun, Xianjie Wu, Tongliang Li, Zhoujun Li. 606-620 [doi]

Debiasing by obfuscating with 007-classifiers promotes fairness in multi-community settingsIngroj Shrestha, Padmini Srinivasan. 621-636 [doi]

Graph Representation Learning in Hyperbolic Space via Dual-MaskedRui Gong, Zuyun Jiang, Daren Zha. 637-646 [doi]

Perturbation-driven Dual Auxiliary Contrastive Learning for Collaborative Filtering RecommendationCaihong Mu, Keyang Zhang, Jialiang Zhou, Yi Liu. 647-657 [doi]

Enhancing Reranking for Recommendation with LLMs through User Preference RetrievalHaobo Zhang, Qiannan Zhu, Zhicheng Dou. 658-671 [doi]

SyntheT2C: Generating Synthetic Data for Fine-Tuning Large Language Models on the Text2Cypher TaskZijie Zhong, Linqing Zhong, Zhaoze Sun, Qingyun Jin, Zengchang Qin, Xiaofan Zhang. 672-692 [doi]

Language Models Encode the Value of Numbers LinearlyFangwei Zhu, Damai Dai, Zhifang Sui. 693-709 [doi]

FinDABench: Benchmarking Financial Data Analysis Ability of Large Language ModelsShu Liu, Shangqing Zhao, Chenghao Jia, Xinlin Zhuang, Zhaoguang Long, Jie Zhou, Aimin Zhou, Man Lan, Yang Chong. 710-725 [doi]

Swift Cross-Dataset Pruning: Enhancing Fine-Tuning Efficiency in Natural Language UnderstandingNguyen Binh Nguyen, Yang He. 726-739 [doi]

SLARD: A Chinese Superior Legal Article Retrieval DatasetZhe Chen, Pengjie Ren, Fuhui Sun, Xiaoyan Wang, Yujun Li, Siwen Zhao, Tengyi Yang. 740-754 [doi]

Compress to Impress: Unleashing the Potential of Compressive Memory in Real-World Long-Term ConversationsNuo Chen 0001, Hongguang Li, Jianhui Chang, Juhua Huang, Baoyuan Wang, Jia Li 0009. 755-773 [doi]

Refined Evaluation for End-to-End Grammatical Error Correction Using an Alignment-Based ApproachJunrui Wang, Mengyang Qiu, Yang Gu, Zihao Huang, Jungyeul Park. 774-785 [doi]

LLMs on interactive feature collections with implicit dynamic decision strategyJuyeon Heo, Vihari Piratla, Kyunghyun Lee 0006, Hyonkeun Joh, Adrian Weller. 786-811 [doi]

Pre-trained Semantic Interaction based Inductive Graph Neural Networks for Text ClassificationShiyu Wang, Gang Zhou, Jicang Lu, Jing Chen, Ningbo Huang. 812-827 [doi]

From Superficial to Deep: Integrating External Knowledge for Follow-up Question Generation Using Knowledge Graph and LLMJianyu Liu, Yi Huang, Sheng Bi, Junlan Feng, Guilin Qi. 828-840 [doi]

AGCL: Aspect Graph Construction and Learning for Aspect-level Sentiment ClassificationZhongQuan Jian, Daihang Wu, Shaopan Wang, Yancheng Wang, Junfeng Yao, Meihong Wang, Qingqiang Wu 0001. 841-854 [doi]

TaCIE: Enhancing Instruction Comprehension in Large Language Models through Task-Centred Instruction EvolutionJiuding Yang, Shengyao Lu, Weidong Guo, Xiangyang Li, Kaitong Yang, Yu Xu, Di Niu. 855-869 [doi]

LLaMA-E: Empowering E-commerce Authoring with Object-Interleaved Instruction FollowingKaize Shi, Xueyao Sun, Dingxian Wang, Yinlin Fu, Guandong Xu 0001, Qing Li 0001. 870-885 [doi]

LLMTreeRec: Unleashing the Power of Large Language Models for Cold-Start RecommendationsWenlin Zhang, Chuhan Wu, Xiangyang Li, Yuhao Wang 0006, Kuicai Dong, Yichao Wang 0002, Xinyi Dai, Xiangyu Zhao 0001, Huifeng Guo, Ruiming Tang. 886-896 [doi]

Collaborative Document Simplification Using Multi-Agent SystemsDengzhao Fang, Jipeng Qiang, Xiaoye Ouyang, Yi Zhu 0006, Yunhao Yuan 0001, Yun Li 0010. 897-912 [doi]

Distilling Rule-based Knowledge into Large Language ModelsWenkai Yang, Yankai Lin, Jie Zhou, Ji-Rong Wen. 913-932 [doi]

Exploring Backdoor Vulnerabilities of Chat ModelsWenkai Yang, Yunzhuo Hao, Yankai Lin. 933-946 [doi]

Towards the Machine Translation of Scientific NeologismsPaul Lerner, François Yvon. 947-963 [doi]

HyperIDP: Customizing Temporal Hypergraph Neural Networks for Multi-Scale Information Diffusion PredictionHaowei Xu, Chao Gao, Xianghua Li, Zhen Wang 0004. 964-977 [doi]

Enhancing multi-modal Relation Extraction with Reinforcement Learning Guided Graph Diffusion FrameworkRui Yang, Rajiv Gupta 0001. 978-988 [doi]

Non-Emotion-Centric Empathetic Dialogue GenerationYuanxiang Huangfu, Peifeng Li, Yaxin Fan, Qiaoming Zhu. 989-999 [doi]

Aligning Retrieval with Reader Needs: Reader-Centered Passage Selection for Open-Domain Question AnsweringChunlei Xin, Shuheng Zhou, Xuanang Chen, Yaojie Lu 0001, Huijia Zhu, Weiqiang Wang, Zhongyi Liu, Xianpei Han, Le Sun 0001. 1000-1012 [doi]

Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive DecodingCheng Wang, Yiwei Wang 0001, Bryan Hooi, Yujun Cai, Nanyun Peng 0001, Kai-Wei Chang. 1013-1026 [doi]

Citation Amnesia: On The Recency Bias of NLP and Other Academic FieldsJan Philip Wahle, Terry Lima Ruas, Mohamed Abdalla, Bela Gipp, Saif M. Mohammad. 1027-1044 [doi]

Low-Resource Fast Text Classification Based on Intra-Class and Inter-Class Distance CalculationYanxu Mao, Peipei Liu, Tiehan Cui, Congying Liu, Datao You. 1045-1056 [doi]

Monte Carlo Tree Search Based Prompt Autogeneration for Jailbreak Attacks against LLMsSuhuang Wu, Huimin Wang, Yutian Zhao, Xian Wu, Yefeng Zheng, Wei Li, Hui Li, Rongrong Ji. 1057-1068 [doi]

LogiGraph: Logical Reasoning with Contrastive Learning and Lightweight Graph NetworksXiang Li 0067, Chen Shi, Yong Xu, Jun Huang 0007. 1069-1079 [doi]

Explaining Relationships Among Research PapersXiangci Li, Jessica Ouyang 0001. 1080-1105 [doi]

From Generalist to Specialist: A Survey of Large Language Models for ChemistryYang Han, Ziping Wan, Lu Chen 0002, Kai Yu 0004, Xin Chen. 1106-1123 [doi]

Latent Space Interpretation for Stylistic Analysis and Explainable Authorship AttributionMilad Alshomary, Narutatsu Ri, Marianna Apidianaki, Ajay Patel, Smaranda Muresan, Kathleen R. McKeown. 1124-1135 [doi]

Read Before Grounding: Scene Knowledge Visual Grounding via Multi-step ParsingHaixiang Zhu, Lixian Su, Shuangming Mao, Jing Ye. 1136-1149 [doi]

Cross-Refine: Improving Natural Language Explanation Generation by Learning in TandemQianli Wang, Tatiana Anikina, Nils Feldhus, Simon Ostermann 0002, Sebastian Möller 0001, Vera Schmitt. 1150-1167 [doi]

BiLD: Bi-directional Logits Difference Loss for Large Language Model DistillationMinchong Li, Feng Zhou, Xiaohui Song. 1168-1182 [doi]

Too Late to Train, Too Early To Use? A Study on Necessity and Viability of Low-Resource Bengali LLMsTamzeed Mahfuz, Satak Kumar Dey, Ruwad Naswan, Hasnaen Adil, Khondker Salman Sayeed, Haz Sameen Shahgir. 1183-1200 [doi]

Do language models practice what they preach? Examining language ideologies about gendered language reform encoded in LLMsJulia Watson, Sophia S. Lee, Barend Beekhuizen, Suzanne Stevenson. 1201-1223 [doi]

T-MES: Trait-Aware Mix-of-Experts Representation Learning for Multi-trait Essay ScoringJiong Wang, Jie Liu 0022. 1224-1236 [doi]

A Graph Interaction Framework on Relevance for Multimodal Named Entity Recognition with Multiple ImagesJiachen Zhao, Shizhou Huang, Xin Lin 0001. 1237-1246 [doi]

Mining Word Boundaries from Speech-Text Parallel Data for Cross-domain Chinese Word SegmentationXuebin Wang, Lei Zhang, Zhenghua Li, Shilin Zhou, Chen Gong 0004, Yang Hou. 1247-1257 [doi]

RoBGuard: Enhancing LLMs to Assess Risk of Bias in Clinical Trial DocumentsChangkai Ji, Bowen Zhao, Zhuoyao Wang, Yingwen Wang, Yuejie Zhang, Ying Cheng 0005, Rui Feng, Xiaobo Zhang. 1258-1277 [doi]

A Compressive Memory-based Retrieval Approach for Event Argument ExtractionWanlong Liu, Enqi Zhang, Shaohuan Cheng, Dingyi Zeng, Li Zhou, Chen Zhang, Malu Zhang, Wenyu Chen. 1278-1293 [doi]

FTFT: Efficient and Robust Fine-Tuning by Transferring Training DynamicsYupei Du, Albert Gatt, Dong Nguyen 0002. 1294-1308 [doi]

PrahokBART: A Pre-trained Sequence-to-Sequence Model for Khmer Natural Language GenerationHour Kaing, Raj Dabre, Haiyue Song, Van-Hien Tran, Hideki Tanaka, Masao Utiyama. 1309-1322 [doi]

Relation Logical Reasoning and Relation-aware Entity Encoding for Temporal Knowledge Graph ReasoningLongzhou Liu, Chenglong Xiao, Shanshan Wang, Tingwen Liu. 1323-1332 [doi]

Awakening Augmented Generation: Learning to Awaken Internal Knowledge of Large Language Models for Question AnsweringHuanxuan Liao, Shizhu He, Yao Xu, Yuanzhe Zhang, Shengping Liu, Kang Liu, Jun Zhao. 1333-1352 [doi]

Dying or Departing? Euphemism Detection for Death Discourse in Historical TextsAli Al-Laith, Alexander Conroy, Jens Bjerring-Hansen, Bolette S. Pedersen, Carsten Levisen, Daniel Hershcovich. 1353-1364 [doi]

ITERATE: Image-Text Enhancement, Retrieval, and Alignment for Transmodal Evolution with LLMsChenhan Fu, Guoming Wang, Juncheng Li 0006, Wenqiao Zhang, Rongxing Lu, Siliang Tang. 1365-1376 [doi]

Multi-Graph Co-Training for Capturing User Intent in Session-based RecommendationZhe Yang, Tiantian Liang. 1377-1386 [doi]

CAST: Cross-modal Alignment Similarity Test for Vision Language ModelsGautier Dagan, Olga Loginova, Anil Batra. 1387-1402 [doi]

Embedding-Informed Adaptive Retrieval-Augmented Generation of Large Language ModelsChengkai Huang, Yu Xia, Rui Wang 0088, Kaige Xie, Tong Yu 0001, Julian J. McAuley, Lina Yao 0001. 1403-1412 [doi]

Investigating the Contextualised Word Embedding Dimensions Specified for Contextual and Temporal Semantic ChangesTaichi Aida, Danushka Bollegala. 1413-1437 [doi]

Uncertainty Modelling in Under-Represented Languages with Bayesian Deep Gaussian ProcessesUbaid Azam, Imran Razzak, Shelly Vishwakarma, Shoaib Jameel. 1438-1450 [doi]

Cross-lingual Text Classification Transfer: The Case of UkrainianDaryna Dementieva, Valeriia Khylenko, Georg Groh. 1451-1464 [doi]

LLM-Personalize: Aligning LLM Planners with Human Preferences via Reinforced Self-Training for Housekeeping RobotsDongge Han, Trevor McInroe, Adam Jelley, Stefano V. Albrecht, Peter Bell 0001, Amos J. Storkey. 1465-1474 [doi]

CEHA: A Dataset of Conflict Events in the Horn of AfricaRui Bai, Di Lu, Shihao Ran, Elizabeth M. Olson, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes. 1475-1495 [doi]

QABISAR: Query-Article Bipartite Interactions for Statutory Article RetrievalT. Y. S. S. Santosh, Hassan Sarwat, Matthias Grabmair. 1496-1502 [doi]

Partial Order-centered Hyperbolic Representation Learning for Few-shot Relation ExtractionBiao Hu, Zhen Huang, Minghao Hu, Pinglv Yang, Peng Qiao, Yong Dou, Zhilin Wang. 1503-1519 [doi]

Taxonomy-Guided Zero-Shot Recommendations with LLMsYueqing Liang, Liangwei Yang, Chen Wang 0018, Xiongxiao Xu, Philip S. Yu, Kai Shu. 1520-1530 [doi]

Enhancing Multi-party Dialogue Discourse Parsing with Explanation GenerationShannan Liu, Peifeng Li, Yaxin Fan, Qiaoming Zhu. 1531-1544 [doi]

MPPO: Multi Pair-wise Preference Optimization for LLMs with Arbitrary Negative SamplesShuo Xie, Fangzhi Zhu, Jiahui Wang, Lulu Wen, Wei Dai, Xiaowei Chen, Junxiong Zhu, Kai Zhou, Bo Zheng. 1545-1554 [doi]

Polysemy Interpretation and Transformer Language Models: A Case of Korean Adverbial Postposition -(u)loSeongmin Mun, Gyu-Ho Shin. 1555-1561 [doi]

A Career Interview Dialogue System using Large Language Model-based Dynamic Slot GenerationEkai Hashimoto, Mikio Nakano, Takayoshi Sakurai, Shun Shiramatsu, Toshitake Komazaki, Shiho Tsuchiya. 1562-1584 [doi]

A Simple-Yet-Efficient Instruction Augmentation Method for Zero-Shot Sentiment ClassificationYang Zhao, Masayasu Muraoka, Issei Yoshida, Bishwaranjan Bhattacharjee, Hiroshi Kanayama. 1585-1599 [doi]

Improving Explainable Fact-Checking with Claim-Evidence CorrelationsXin Tan, Bowei Zou, Ai Ti Aw. 1600-1612 [doi]

Analyzing Continuous Semantic Shifts with Diachronic Word Similarity MatricesHajime Kiyama, Taichi Aida, Mamoru Komachi, Toshinobu Ogiso, Hiroya Takamura, Daichi Mochihashi. 1613-1631 [doi]

A Testset for Context-Aware LLM Translation in Korean-to-English Discourse Level TranslationMinJae Lee, Youngbin Noh, Seung-Jin Lee. 1632-1646 [doi]

MoSLD: An Extremely Parameter-Efficient Mixture-of-Shared LoRAs for Multi-Task LearningLulu Zhao, Weihao Zeng, Xiaofeng Shi, Hua Zhou. 1647-1659 [doi]

A Combinatorial Approach to Neural Emergent CommunicationZheyuan Zhang. 1660-1666 [doi]

Multi-perspective Preference Alignment of LLMs for Programming-Community Question AnsweringHongyu Yang, Jiahui Hou, Liyang He, Rui Li. 1667-1682 [doi]

Learning to Refuse: Towards Mitigating Privacy Risks in LLMsZhenhua Liu, Tong Zhu 0002, Chuanyuan Tan, Wenliang Chen. 1683-1698 [doi]

Exploring Unified Training Framework for Multimodal User ProfilingMinjie Qiang, Zhongqing Wang, Shoushan Li, Guodong Zhou. 1699-1710 [doi]

Acquiring Bidirectionality via Large and Small Language ModelsTakumi Goto, Hiroyoshi Nagao, Yuta Koreeda. 1711-1717 [doi]

Enhancing One-Shot Pruned Pre-trained Language Models through Sparse-Dense-Sparse MechanismGuanchen Li, Xiandong Zhao, Lian Liu, Zeping Li, Yixing Xu, Dong Li 0025, Lu Tian, Jie He, Ashish Sirasao, Emad Barsoum. 1718-1735 [doi]

Language Models over Large-Scale Knowledge Base: on Capacity, Flexibility and Reasoning for New FactsQiyuan He, Yizhong Wang, Jianfei Yu, Wenya Wang. 1736-1753 [doi]

Multi-View Incongruity Learning for Multimodal Sarcasm DetectionDiandian Guo, Cong Cao 0001, Fangfang Yuan, Yanbing Liu, Guangjie Zeng, Xiaoyan Yu, Hao Peng 0001, Philip S. Yu. 1754-1766 [doi]

Cognitive Biases, Task Complexity, and Result Intepretability in Large Language ModelsMario Mina, Valle Ruíz-Fernández, Júlia Falcão, Luis Vasquez-Reina, Aitor Gonzalez-Agirre. 1767-1784 [doi]

Robustness Evaluation of the German Extractive Question Answering TaskShalaka Satheesh, Katharina Beckh, Katrin Klug, Héctor Allende-Cid, Sebastian Houben, Teena Hassan. 1785-1801 [doi]

Enhancing Multimodal Named Entity Recognition through Adaptive Mixup Image AugmentationBo Xu 0023, Haiqi Jiang, Jie Wei, Hongyu Jing, Ming Du, Hui Song, Hongya Wang, Yanghua Xiao. 1802-1812 [doi]

Bridging Modality Gap for Effective Multimodal Sentiment Analysis in Fashion-related Social MediaZheyu Zhao, Zhongqing Wang, Shichen Li, Hongling Wang, Guodong Zhou. 1813-1823 [doi]

Quality Beyond A Glance: Revealing Large Quality Differences Between Web-Crawled Parallel CorporaRik van Noord, Miquel Esplà-Gomis, Malina Chichirau, Gema Ramírez-Sánchez, Antonio Toral. 1824-1838 [doi]

MLLM-I2W: Harnessing Multimodal Large Language Model for Zero-Shot Composed Image RetrievalTong Bao, Che Liu, Derong Xu, Zhi Zheng 0008, Tong Xu 0001. 1839-1849 [doi]

Linguistic Features Extracted by GPT-4 Improve Alzheimer's Disease Detection based on Spontaneous SpeechJonathan Heitz, Gerold Schneider, Nicolas Langer. 1850-1864 [doi]

Does Vision Accelerate Hierarchical Generalization in Neural Language Learners?Tatsuki Kuribayashi, Timothy Baldwin. 1865-1879 [doi]

Efficient Solutions For An Intriguing Failure of LLMs: Long Context Window Does Not Mean LLMs Can Analyze Long Sequences FlawlesslyPeyman Hosseini, Ignacio Castro, Iacopo Ghinassi, Matthew Purver. 1880-1891 [doi]

MLD-EA: Check and Complete Narrative Coherence by Introducing Emotions and ActionsJinming Zhang, Yunfei Long. 1892-1907 [doi]

SubRegWeigh: Effective and Efficient Annotation Weighing with Subword RegularizationKohei Tsuji, Tatsuya Hiraoka, Yuchang Cheng, Tomoya Iwakura. 1908-1921 [doi]

Rethinking Long Context Generation from the Continual Learning PerspectiveZeyuan Yang, Fangzhou Xiong, Peng Li, Yang Liu. 1922-1933 [doi]

LTRS: Improving Word Sense Disambiguation via Learning to Rank SensesHansi Wang, Yue Wang, Qiliang Liang, Yang Liu. 1934-1942 [doi]

Are Your Keywords Like My Queries? A Corpus-Wide Evaluation of Keyword Extractors with Real SearchesMartina Galletti, Giulio Prevedello, Emanuele Brugnoli, Donald Ruggiero Lo Sardo, Pietro Gravino. 1943-1951 [doi]

NYT-Connections: A Deceptively Simple Text Classification Task that Stumps System-1 ThinkersAngel Yahir Loredo Lopez, Tyler McDonald, Ali Emami. 1952-1963 [doi]

How Well Can Large Language Models Reflect? A Human Evaluation of LLM-generated Reflections for Motivational Interviewing DialoguesErkan Basar, Xin Sun 0016, Iris Hendrickx, Jan de Wit, Tibor Bosse, Gert-Jan de Bruijn, Jos A. Bosch, Emiel Krahmer. 1964-1982 [doi]

Rethinking the Alignment of Psychotherapy Dialogue Generation with Motivational Interviewing StrategiesXin Sun 0016, Xiao Tang, Abdallah El-Ali, Zhuying Li, Pengjie Ren, Jan de Wit, Jiahuan Pei, Jos A. Bosch. 1983-2002 [doi]

Enhancing Zero-shot Chain of Thought Prompting via Uncertainty-Guided Strategy SelectionShanu Kumar, Saish Mendke, Karody Lubna Abdul Rahman, Santosh Kurasa, Parag Agrawal, Sandipan Dandapat. 2003-2025 [doi]

Word-level Cross-lingual Structure in Large Language ModelsZihao Feng, Hailong Cao, Wang Xu, Tiejun Zhao. 2026-2037 [doi]

Trucidator: Document-level Event Factuality Identification via Hallucination Enhancement and Cross-Document InferenceZihao Zhang, Zhong Qian, Xiaoxu Zhu, Peifeng Li, Qiaoming Zhu. 2038-2048 [doi]

RoLargeSum: A Large Dialect-Aware Romanian News Dataset for Summary, Headline, and Keyword GenerationAndrei-Marius Avram, Mircea Timpuriu, Andreea Iuga, Vlad-Cristian Matei, Iulian-Marius Taiatu, Tudor Gaina, Dumitru-Clementin Cercel, Mihaela-Claudia Cercel, Florin Pop. 2049-2066 [doi]

From Detection to Explanation: Effective Learning Strategies for LLMs in Online Abusive Language ResearchChiara Di Bonaventura, Lucia Siciliani, Pierpaolo Basile, Albert Meroño-Peñuela, Barbara McGillivray. 2067-2084 [doi]

TEEMIL : Towards Educational MCQ Difficulty Estimation in Indic LanguagesManikandan Ravikiran, Siddharth Vohra, Rajat Verma, Rohit Saluja, Arnav Bhavsar. 2085-2099 [doi]

What's Wrong? Refining Meeting Summaries with LLM FeedbackFrederic Thomas Kirstein, Terry Lima Ruas, Bela Gipp. 2100-2120 [doi]

Scene Graph and Dependency Grammar Enhanced Remote Sensing Change Caption Network (SGD-RSCCN)Qiaoli Sun, Yan Wang, Xiaoyu Song. 2121-2130 [doi]

Looking at the Unseen: Effective Sampling of Non-Related Propositions for Argument MiningRamon Ruiz-Dolz, Debela Gemechu, Zlata Kikteva, Chris Reed 0001. 2131-2143 [doi]

"Not Aligned" is Not "Malicious": Being Careful about Hallucinations of Large Language Models' JailbreakLingrui Mei, Shenghua Liu, Yiwei Wang, Baolong Bi, Jiayi Mao, Xueqi Cheng. 2144-2162 [doi]

From Form to Meaning: The Case of Particles within the Prague Dependency Treebank Annotation SchemeMarie Mikulová, Barbora Stepánková, Jan Stepánek. 2163-2175 [doi]

Enhancing Long-range Dependency with State Space Model and Kolmogorov-Arnold Networks for Aspect-based Sentiment AnalysisAdamu Lawan, Juhua Pu, Yunusa Haruna, Aliyu Umar, Muhammad Lawan. 2176-2186 [doi]

ROUGE-SciQFS: A ROUGE-based Method to Automatically Create Datasets for Scientific Query-Focused SummarizationJuan Antonio Ramirez-Orta, Ana Gabriela Maguitman, Axel J. Soto, Evangelos E. Milios. 2187-2197 [doi]

Commonsense Subgraph for Inductive Relation Reasoning with Meta-learningFeng Zhao, Zhilu Zhang, Cheng Yan, Xianggan Liu. 2198-2206 [doi]

Clear Up Confusion: Iterative Differential Generation for Fine-grained Intent Detection with Contrastive FeedbackFeng Zhang, Wei Chen 0056, Meng Gao, Fei Ding, Tengjiao Wang 0003, Jiahui Yao, Jiabin Zheng. 2207-2221 [doi]

Leveraging Explicit Reasoning for Inference Integration in Commonsense-Augmented Dialogue ModelsSarah E. Finch, Jinho D. Choi. 2222-2235 [doi]

Integrating Group-based Preferences from Coarse to Fine for Cold-start Users RecommendationSiyu Wang, Jianhui Jiang, Jiangtao Qiu, Shengran Dai. 2236-2245 [doi]

Automatic Multiple-Choice Question Generation and Evaluation Systems Based on LLM: A Study Case With University ResolutionsSérgio Silva Mucciaccia, Thiago Meireles Paixão, Filipe Wall Mutz, Claudine Santos Badue, Alberto Ferreira de Souza, Thiago Oliveira-Santos. 2246-2260 [doi]

Generating Commonsense Reasoning Questions with Controllable Complexity through Multi-step Structural CompositionJianxing Yu, Shiqi Wang 0016, Hanjiang Lai, Wenqing Chen, Yanghui Rao, Qinliang Su, Jian Yin 0001. 2261-2276 [doi]

DnA-Eval: Enhancing Large Language Model Evaluation through Decomposition and AggregationMinzhi Li, Zhengyuan Liu, Shumin Deng, Shafiq Joty, Nancy Chen, Min-Yen Kan. 2277-2290 [doi]

Towards Faithful Multi-step Reasoning through Fine-Grained Causal-aware Attribution Reasoning DistillationZheng Chu, Jingchang Chen, Zhongjie Wang 0003, Guo Tang, Qianglong Chen, Ming Liu 0004, Bing Qin 0001. 2291-2315 [doi]

AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization ConfigurationsQian Tao, Wenyuan Yu, Jingren Zhou. 2316-2328 [doi]

E-Bench: Towards Evaluating the Ease-of-Use of Large Language ModelsZhenyu Zhang, Bingguang Hao, Jinpeng Li 0003, Zekai Zhang, Dongyan Zhao 0001. 2329-2339 [doi]

Enhancing Online Grooming Detection via Backtranslation AugmentationHamed Waezi, Hossein Fani 0001. 2340-2350 [doi]

CausalScore: An Automatic Reference-Free Metric for Assessing Response Relevance in Open-Domain Dialogue SystemsTao Feng 0013, Lizhen Qu, Xiaoxi Kang, Gholamreza Haffari. 2351-2369 [doi]

Exploring the Impact of Language Switching on Personality Traits in LLMsJacopo Amidei, Jose Gregorio Ferreira De Sá, Rubén Nieto Luna, Andreas Kaltenbrunner. 2370-2378 [doi]

LLMs Know What They Need: Leveraging a Missing Information Guided Framework to Empower Retrieval-Augmented GenerationKeheng Wang, Feiyu Duan, Peiguang Li, Sirui Wang, Xunliang Cai. 2379-2400 [doi]

Chain-of-Specificity: Enhancing Task-Specific Constraint Adherence in Large Language ModelsKaiwen Wei, Jiang Zhong, Hongzhi Zhang, Fuzheng Zhang, Di Zhang, Li Jin 0001, Yue Yu, Jingyuan Zhang. 2401-2416 [doi]

How Transliterations Improve Crosslingual AlignmentYihong Liu, Mingyang Wang, Amir Hossein Kargaran, Ayyoob Imani, Orgest Xhelili, Haotian Ye, Chunlan Ma, François Yvon, Hinrich Schütze. 2417-2433 [doi]

GL-GAN: Perceiving and Integrating Global and Local Styles for Handwritten Text Generation with MambaYiming Wang, Hongxi Wei, Heng Wang, Shiwen Sun, Chao He. 2434-2444 [doi]

Discrete Subgraph Sampling for Interpretable Graph based Visual Question AnsweringPascal Tilli, Ngoc Thang Vu. 2445-2455 [doi]

From Multiple-Choice to Extractive QA: A Case Study for English and ArabicTeresa Lynn, Malik H. Altakrori, Samar Mohamed Magdy, Rocktim Jyoti Das, Chenyang Lyu, Mohamed Nasr, Younes Samih, Kirill Chirkunov, Alham Fikri Aji, Preslav Nakov, Shantanu Godbole, Salim Roukos, Radu Florian, Nizar Habash. 2456-2477 [doi]

Enhancing Knowledge Distillation of Large Language Models through Efficient Multi-Modal Distribution AlignmentTianyu Peng, Jiajun Zhang. 2478-2496 [doi]

DialogueMMT: Dialogue Scenes Understanding Enhanced Multi-modal Multi-task Tuning for Emotion Recognition in ConversationsChenyuan He, Senbin Zhu, Hongde Liu, Fei Gao, Yuxiang Jia, Hongying Zan, Min Peng. 2497-2512 [doi]

Learning Transition Patterns by Large Language Models for Sequential RecommendationJianyang Zhai, Zi-Feng Mai, Dongyi Zheng, Chang-Dong Wang, Xiawu Zheng, Hui Li 0057, Feidiao Yang, Yonghong Tian 0001. 2513-2525 [doi]

Aligning Large Language Models with Human Opinions through Persona Selection and Value-Belief-Norm ReasoningXuan Long Do, Kenji Kawaguchi, Min-Yen Kan, Nancy F. Chen. 2526-2547 [doi]

MiMoTable: A Multi-scale Spreadsheet Benchmark with Meta Operations for Table ReasoningZheng Li, Yang Du, Mao Zheng, MingYang Song. 2548-2560 [doi]

Implicit Discourse Relation Classification For Nigerian PidginMuhammed Saeed, Peter Bourgonje, Vera Demberg. 2561-2574 [doi]

How Many Languages Make Good Multilingual Instruction Tuning? A Case Study on BLOOMShaoxiong Ji, Pinzhen Chen. 2575-2581 [doi]

Gradient Inversion Attack in Federated Learning: Exposing Text Data through Discrete OptimizationYing Gao 0006, Yuxin Xie, Huanghao Deng, Zukun Zhu. 2582-2591 [doi]

Simulating Dual-Process Thinking in Dialogue Topic Shift DetectionHuiyao Wang, Peifeng Li, Yaxin Fan, Qiaoming Zhu. 2592-2602 [doi]

A Compliance Checking Framework Based on Retrieval Augmented GenerationJingyun Sun, Zhongze Luo, Yang Li. 2603-2615 [doi]

MIDLM: Multi-Intent Detection with Bidirectional Large Language ModelsShangjian Yin, Peijie Huang, Yuhong Xu. 2616-2625 [doi]

ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language ModelsChenyang Song, Xu Han 0007, Zhengyan Zhang, Shengding Hu, Xiyu Shi, Kuai Li, Chen Chen, Zhiyuan Liu 0001, Guangli Li, Tao Yang, Maosong Sun 0001. 2626-2644 [doi]

Reasoning-Oriented and Analogy-Based Methods for Locating and Editing in Zero-Shot Event-Relational ReasoningJingyao Tang, Lishuang Li, Liteng Mi, Haiming Wu, Hongbin Lu. 2645-2657 [doi]

Leveraging Language Models for Summarizing Mental State Examinations: A Comprehensive Evaluation and Dataset ReleaseNilesh Kumar Sahu, Manjeet Yadav, Mudita Chaturvedi, Snehil Gupta, Haroon R. Lone. 2658-2682 [doi]

Oddballness: universal anomaly detection with language modelsFilip Gralinski, Ryszard Staruch, Krzysztof Jurkiewicz. 2683-2689 [doi]

CMMaTH: A Chinese Multi-modal Math Skill Evaluation Benchmark for Foundation ModelsZhongzhi Li, Ming-Liang Zhang 0005, Pei-Jie Wang, Jian Xu, Rui-Song Zhang, Yin Fei, Zhi-Long Ji, Jin-Feng Bai, Zhen-Ru Pan, Jiaxin Zhang, Cheng-Lin Liu. 2690-2726 [doi]

Efficient Tool Use with Chain-of-Abstraction ReasoningSilin Gao, Jane Dwivedi-Yu, Ping Yu, Xiaoqing Ellen Tan, Ramakanth Pasunuru, Olga Golovneva, Koustuv Sinha, Asli Celikyilmaz, Antoine Bosselut, Tianlu Wang. 2727-2743 [doi]

Enhancing Arabic NLP Tasks through Character-Level Models and Data AugmentationMohanad Mohamed, Sadam Al-Azani. 2744-2757 [doi]

The Gaps between Fine Tuning and In-context Learning in Bias Evaluation and DebiasingMasahiro Kaneko, Danushka Bollegala, Timothy Baldwin. 2758-2764 [doi]

LLM Sensitivity Challenges in Abusive Language Detection: Instruction-Tuned vs. Human FeedbackYaqi Zhang, Viktor Hangya, Alexander Fraser 0001. 2765-2780 [doi]

Improving Automatic Grammatical Error Annotation for Chinese Through Linguistically-Informed Error TypologyYang Gu, Zihao Huang, Min Zeng, Mengyang Qiu, Jungyeul Park. 2781-2798 [doi]

Bias Vector: Mitigating Biases in Language Models with Task Arithmetic ApproachDaiki Shirafuji, Makoto Takenaka, Shinya Taguchi. 2799-2813 [doi]

Topology-of-Question-Decomposition: Enhancing Large Language Models with Information Retrieval for Knowledge-Intensive TasksWeijie Li, Jin Wang 0008, Liang-Chih Yu, Xuejie Zhang 0002. 2814-2833 [doi]

t-HNE: A Text-guided Hierarchical Noise Eliminator for Multimodal Sentiment AnalysisZuocheng Li, Lishuang Li. 2834-2844 [doi]

ALYMPICS: LLM Agents Meet Game TheoryShaoguang Mao, Yuzhe Cai, Yan Xia 0005, Wenshan Wu, Xun Wang, Fengyi Wang, Qiang Guan, Tao Ge 0001, Furu Wei. 2845-2866 [doi]

Towards Adaptive Mechanism Activation in Language AgentZiyang Huang, Jun Zhao, Kang Liu. 2867-2885 [doi]

Scaffolding Coordinates to Promote Vision-Language Coordination in Large Multi-Modal ModelsXuanyu Lei, Zonghan Yang, Xinrui Chen, Peng Li, Yang Liu. 2886-2903 [doi]

Retrieval Augmented Instruction Tuning for Open NER with Large Language ModelsTingyu Xie, Jian Zhang, Yan Zhang, Yuanyuan Liang, Qi Li, Hongwei Wang. 2904-2918 [doi]

Rethinking Vocabulary Augmentation: Addressing the Challenges of Low-Resource Languages in Multilingual ModelsNankai Lin, Peijian Zeng, Weixiong Zheng, Shengyi Jiang, Dong Zhou 0001, Aimin Yang. 2919-2934 [doi]

Hawkes based Representation Learning for Reasoning over Scale-free Community-structured Temporal Knowledge GraphsYuwei Du, Xinyue Liu, Wenxin Liang, Linlin Zong, Xianchao Zhang 0001. 2935-2946 [doi]

Intention Analysis Makes LLMs A Good Jailbreak DefenderYuqi Zhang, Liang Ding 0006, Lefei Zhang, Dacheng Tao. 2947-2968 [doi]

Towards Understanding Multi-Task Learning (Generalization) of LLMs via Detecting and Exploring Task-Specific NeuronsYongqi Leng, Deyi Xiong. 2969-2987 [doi]

Do Large Language Models Mirror Cognitive Language Processing?Yuqi Ren, Renren Jin, Tongxuan Zhang, Deyi Xiong. 2988-3001 [doi]

SAGED: A Holistic Bias-Benchmarking Pipeline for Language Models with Customisable Fairness CalibrationXin Guan, Nathaniel Demchak, Saloni Gupta, Ze Wang, Ediz Ertekin Jr., Adriano S. Koshiyama, Emre Kazim, Zekun Wu 0003. 3002-3026 [doi]

Learning to Reason via Self-Iterative Process Feedback for Small Language ModelsKaiYuan Chen, Jin Wang, Xuejie Zhang. 3027-3042 [doi]

Rethinking-based Code Summarization with Chain of CommentsLiuwen Cao, Hongkui He, Hailin Huang, Jiexin Wang, Yi Cai 0001. 3043-3056 [doi]

RGR-KBQA: Generating Logical Forms for Question Answering Using Knowledge-Graph-Enhanced Large Language ModelTengfei Feng, Liang He. 3057-3070 [doi]

To Label or Not to Label: Hybrid Active Learning for Neural Machine TranslationAbdul Hameed Azeemi, Ihsan Ayyub Qazi, Agha Ali Raza. 3071-3082 [doi]

LLM Sensitivity Evaluation Framework for Clinical DiagnosisChenwei Yan, Xiangling Fu, Yuxuan Xiong, Tianyi Wang, Siu Cheung Hui, Ji Wu 0002, Xien Liu. 3083-3094 [doi]

Unveiling Uncertainty: A Deep Dive into Calibration and Performance of Multimodal Large Language ModelsZijun Chen, Wenbo Hu 0001, Guande He, Zhijie Deng, Zheng Zhang 0006, Richang Hong. 3095-3109 [doi]

Unifying Dual-Space Embedding for Entity Alignment via Contrastive LearningCunda Wang, Weihua Wang, Qiuyu Liang, Feilong Bao, Guanglai Gao. 3110-3122 [doi]

Aspect-Based Sentiment Analysis with Syntax-Opinion-Sentiment Reasoning ChainRui Fan, Shu Li, Tingting He, Yu Liu. 3123-3137 [doi]

Reasoning with Trees: Faithful Question Answering over Knowledge GraphTiesunlong Shen, Jin Wang, Xuejie Zhang, Erik Cambria. 3138-3157 [doi]

Revisiting Jailbreaking for Large Language Models: A Representation Engineering PerspectiveTianlong Li, Zhenghua Wang, Wenhao Liu, Muling Wu, Shihan Dou, Changze Lv, Xiaohua Wang, Xiaoqing Zheng, Xuanjing Huang. 3158-3178 [doi]

Lexicography Saves Lives (LSL): Automatically Translating Suicide-Related LanguageAnnika Marie Schoene, John E. Ortega, Rodolfo Joel Zevallos Salazar, Laura Haaber Ihle. 3179-3192 [doi]

Enhancing Emotional Support Conversations: A Framework for Dynamic Knowledge Filtering and Persona ExtractionJiawang Hao, Fang Kong. 3193-3202 [doi]

SKIntern: Internalizing Symbolic Knowledge for Distilling Better CoT Capabilities into Small Language ModelsHuanxuan Liao, Shizhu He, Yupu Hao, Xiang Li, Yuanzhe Zhang, Jun Zhao, Kang Liu. 3203-3221 [doi]

TermDiffuSum: A Term-guided Diffusion Model for Extractive Summarization of Legal DocumentsXiangyun Dong, Wei Li, Yuquan Le, Zhangyue Jiang, Junxi Zhong, Zhong Wang. 3222-3235 [doi]

COF: Adaptive Chain of Feedback for Comparative Opinion Quintuple ExtractionQingting Xu, Kaisong Song, Chaoqun Liu, Yangyang Kang, Xiabing Zhou, Jun Lin, Yu Hong 0001. 3236-3247 [doi]

MBA-RAG: a Bandit Approach for Adaptive Retrieval-Augmented Generation through Question ComplexityXiaqiang Tang, Qiang Gao, Jian Li, Nan Du, Qi Li, Sihong Xie. 3248-3254 [doi]

Improvement in Sign Language Translation Using Text CTC AlignmentSihan Tan, Taro Miyazaki, Nabeela Khan, Kazuhiro Nakadai. 3255-3266 [doi]

Gracefully Filtering Backdoor Samples for Generative Large Language Models without RetrainingZongru Wu, Pengzhou Cheng, Lingyong Fang, Zhuosheng Zhang 0001, Gongshen Liu. 3267-3282 [doi]

MQM-Chat: Multidimensional Quality Metrics for Chat TranslationYunmeng Li, Jun Suzuki 0001, Makoto Morishita, Kaori Abe, Kentaro Inui. 3283-3299 [doi]

Intent Contrastive Learning Based on Multi-view Augmentation for Sequential RecommendationBo Pei, Yingzheng Zhu, Guangjin Wang, Huajuan Duan, Wenya Wu, Fuyong Xu, Yizhao Zhu, Peiyu Liu 0001, Ran Lu. 3300-3309 [doi]

Benchmark Self-Evolving: A Multi-Agent Framework for Dynamic LLM EvaluationSiyuan Wang, Zhuohan Long, Zhihao Fan, Xuanjing Huang 0001, Zhongyu Wei. 3310-3328 [doi]

Controlling Out-of-Domain Gaps in LLMs for Genre Classification and Generated Text DetectionDmitri Roussinov, Serge Sharoff, Nadezhda Puchnina. 3329-3344 [doi]

Finetuning LLMs for Comparative Assessment TasksVatsal Raina, Adian Liusie, Mark J. F. Gales. 3345-3352 [doi]

Hermit Kingdom Through the Lens of Multiple Perspectives: A Case Study of LLM Hallucination on North KoreaEunjung Cho, Won-Ik Cho, Soomin Seo. 3353-3371 [doi]

CycleOIE: A Low-Resource Training Framework For Open Information ExtractionZhihong Jin, Chunhong Zhang, Zheng Hu 0001, Jibin Yu, Ruiqi Ma, Qingyun Chen, Xiaohao Liao, Yanxing Zhang. 3372-3390 [doi]

AHVE-CNER: Aligned Hanzi Visual Encoding Enhance Chinese Named Entity Recognition with Multi-InformationXuhui Zheng, Zhiyuan Min, Bin Shi, Hao Wang. 3391-3400 [doi]

Edit-Wise Preference Optimization for Grammatical Error CorrectionJiehao Liang, Haihui Yang, Shiping Gao, Xiaojun Quan. 3401-3414 [doi]

You Only Query Twice: Multimodal Rumor Detection via Evidential Evaluation from Dual PerspectivesJunyi Chen, Leyuan Liu 0002, Tian Lan 0005, Fan Zhou 0002, Xiaosong Zhang. 3415-3427 [doi]

On Evaluation Protocols for Data Augmentation in a Limited Data ScenarioFrédéric Piedboeuf, Philippe Langlais. 3428-3443 [doi]

Context-Informed Machine Translation of Manga using Multimodal Large Language ModelsPhilip Lippmann, Konrad Skublicki, Joshua B. Tanner, Shonosuke Ishiwatari, Jie Yang 0028. 3444-3464 [doi]

Large Language Model as a Teacher for Zero-shot Tagging at Extreme ScalesJinbin Zhang, Nasib Ullah, Rohit Babbar. 3465-3478 [doi]

NovAScore: A New Automated Metric for Evaluating Document Level NoveltyLin Ai, Ziwei Gong, Harshsaiprasad Deshpande, Alexander Johnson, Emmy Phung, Ahmad Emami, Julia Hirschberg. 3479-3494 [doi]

HLU: Human Vs LLM Generated Text Detection Dataset for Urdu at Multiple GranularitiesIqra Ali, Jesse Atuhurra, Hidetaka Kamigaito, Taro Watanabe. 3495-3510 [doi]

Embedding Style Beyond Topics: Analyzing Dispersion Effects Across Different Language ModelsBenjamin Icard, Evangelia Zve, Lila Sainero, Alice Breton, Jean-Gabriel Ganascia. 3511-3522 [doi]

Evaluating the Capabilities of Large Language Models for Multi-label Emotion UnderstandingTadesse Destaw Belay, Israel Abebe Azime, Abinew Ali Ayele, Grigori Sidorov, Dietrich Klakow, Philipp Slusallek, Olga Kolesnikova, Seid Muhie Yimam. 3523-3540 [doi]

Knowledge Graph Unlearning with SchemaYang Xiao, Ruimeng Ye, Bo Hui 0001. 3541-3546 [doi]

Assessing the Human Likeness of AI-Generated CounterspeechXiaoying Song, Sujana Mamidisetty, Eduardo Blanco 0002, Lingzi Hong. 3547-3559 [doi]

Discarding the Crutches: Adaptive Parameter-Efficient Expert Meta-Learning for Continual Semantic ParsingRuiheng Liu, Jinyu Zhang, Yanqi Song, Yu Zhang 0030, BaiLong Yang. 3560-3578 [doi]

Improving Multilingual Sign Language Translation with Automatically Clustered Language Family InformationRuiquan Zhang, Cong Hu, Pei Yu, Yidong Chen 0001. 3579-3588 [doi]

Is Peer-Reviewing Worth the Effort?Kenneth Ward Church, Raman Chandrasekar, John E. Ortega, Ibrahim Said Ahmad. 3589-3599 [doi]

OptiPrune: Effective Pruning Approach for Every Target SparsityKhang Nguyen Le, Ryo Sato, Dai Nakashima, Takeshi Suzuki, Minh Le Nguyen. 3600-3612 [doi]

ChatCite: LLM Agent with Human Workflow Guidance for Comparative Literature SummaryYutong Li, Lu Chen 0002, Aiwei Liu, Kai Yu 0004, Lijie Wen 0001. 3613-3630 [doi]

Paraphrase Makes Perfect: Leveraging Expression Paraphrase to Improve Implicit Sentiment LearningXia Li, Junlang Wang, Yongqiang Zheng, Yuan Chen, Yangjia Zheng. 3631-3647 [doi]

Not Every Metric is Equal: Cognitive Models for Predicting N400 and P600 Components During Reading ComprehensionLavinia Salicchi, Yu-Yin Hsu. 3648-3654 [doi]

Multilingual Supervision Improves Semantic Disambiguation of AdpositionsWesley Scivetti, Lauren Levine, Nathan Schneider 0001. 3655-3669 [doi]

Empirical Study of Zero-shot Keyphrase Extraction with Large Language ModelsByungha Kang, Youhyun Shin. 3670-3686 [doi]

Investigating the Impact of Incremental Processing and Voice Activity Projection on Spoken Dialogue SystemsYuya Chiba, Ryuichiro Higashinaka. 3687-3696 [doi]

Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval AugmentationRuiyang Ren, Yuhao Wang, Yingqi Qu, Wayne Xin Zhao, Jing Liu 0003, Hua Wu 0003, Ji-Rong Wen, Haifeng Wang 0001. 3697-3715 [doi]

Zero-to-Strong Generalization: Eliciting Strong Capabilities of Large Language Models Iteratively without Gold LabelsChaoqun Liu, Qin Chao, Wenxuan Zhang, Xiaobao Wu, Boyang Li 0001, Anh Tuan Luu, Lidong Bing. 3716-3731 [doi]

Alternate Preference Optimization for Unlearning Factual Knowledge in Large Language ModelsAnmol Reddy Mekala, Vineeth Dorna, Shreya Dubey, Abhishek Lalwani, David Koleczek, Mukund Rungta, Sadid A. Hasan, Elita A. Lobo. 3732-3752 [doi]

Counting-Stars: A Multi-evidence, Position-aware, and Scalable Benchmark for Evaluating Long-Context Large Language ModelsMingYang Song, Mao Zheng, Xuan Luo. 3753-3763 [doi]

Personalized Large Language Model Assistant with Evolving Conditional MemoryRuifeng Yuan, Shichao Sun, Yongqi Li 0001, Zili Wang, Ziqiang Cao, Wenjie Li. 3764-3777 [doi]

ReLayout: Towards Real-World Document Understanding via Layout-enhanced Pre-trainingZhouqiang Jiang, Bowen Wang, Junhao Chen, Yuta Nakashima. 3778-3793 [doi]

Gen-SQL: Efficient Text-to-SQL By Bridging Natural Language Question And Database Schema With Pseudo-SchemaJie Shi, Bo Xu 0023, Jiaqing Liang, Yanghua Xiao, Jia Chen, Chenhao Xie 0002, Peng Wang 0027, Wei Wang 0009. 3794-3807 [doi]

Language Models at the Syntax-Semantics Interface: A Case Study of the Long-Distance Binding of Chinese Reflexive ZijiXiulin Yang. 3808-3824 [doi]

HyperHatePrompt: A Hypergraph-based Prompting Fusion Model for Multimodal Hate DetectionBo Xu, Erchen Yu, Jiahui Zhou, Hongfei Lin, Linlin Zong. 3825-3835 [doi]

GenWebNovel: A Genre-oriented Corpus of Entities in Chinese Web NovelsHanjie Zhao, Yuchen Yan, Senbin Zhu, Hongde Liu, Yuxiang Jia, Hongying Zan, Min Peng. 3836-3849 [doi]

Automated Progressive Red TeamingBojian Jiang, Yi Jing, Tong Wu, Tianhao Shen, Deyi Xiong, Qing Yang. 3850-3864 [doi]

Rumor Detection on Social Media with Temporal Propagation Structure OptimizationXingyu Peng, Junran Wu, Ruomei Liu, Ke Xu 0001. 3865-3878 [doi]

Revisiting Implicitly Abusive Language Detection: Evaluating LLMs in Zero-Shot and Few-Shot SettingsJulia Jaremko, Dagmar Gromann, Michael Wiegand. 3879-3898 [doi]

Grading Massive Open Online Courses Using Large Language ModelsShahriar Golchin, Nikhil Garuda, Christopher Impey, Matthew C. Wenger. 3899-3912 [doi]

Decoding Echo Chambers: LLM-Powered Simulations Revealing Polarization in Social NetworksChenxi Wang, Zongfang Liu, Dequan Yang, Xiuying Chen. 3913-3923 [doi]

Parameter-Efficient Fine-Tuning of Large Language Models via Deconvolution in SubspaceJia-Chen Zhang, Yu-Jie Xiong, Chun-Ming Xia, Dong-Hai Zhu, Xihe Qiu. 3924-3935 [doi]

StoryLLaVA: Enhancing Visual Storytelling with Multi-Modal Large Language ModelsLi Yang, Zhiding Xiao, Wenxin Huang, Xian Zhong. 3936-3951 [doi]

Aligning Complex Knowledge Graph Question Answering as Knowledge-Aware Constrained Code GenerationPrerna Agarwal, Nishant Kumar, Srikanta Bedathur Jagannath. 3952-3978 [doi]

KnowledgePrompts: Exploring the Abilities of Large Language Models to Solve Proportional Analogies via Knowledge-Enhanced PromptingThilini Wijesiriwardene, Ruwan Wickramarachchi, Sreeram Reddy Vennam, Vinija Jain, Aman Chadha, Amitava Das, Ponnurangam Kumaraguru, Amit P. Sheth. 3979-3996 [doi]

Unified Grid Tagging Scheme for Aspect Sentiment Quad PredictionGuixin Su, Yongcheng Zhang, Tongguan Wang, Mingmin Wu, Ying Sha. 3997-4010 [doi]

Claim veracity assessment for explainable fake news detectionBassamtiano Renaufalgi Irnawan, Sheng Xu, Noriko Tomuro, Fumiyo Fukumoto, Yoshimi Suzuki. 4011-4029 [doi]

ACE-M³: Automatic Capability Evaluator for Multimodal Medical ModelsXiechi Zhang, Shunfan Zheng, Linlin Wang, Gerard de Melo, Zhu Cao, Xiaoling Wang, Liang He 0001. 4030-4054 [doi]

A Dual Contrastive Learning Framework for Enhanced Multimodal Conversational Emotion RecognitionYunhe Xie, Chengjie Sun, Ziyi Cao, Bingquan Liu, Zhenzhou Ji, Yuanchao Liu, Lili Shan. 4055-4065 [doi]

Can LLMs Clarify? Investigation and Enhancement of Large Language Models on Argument Claim OptimizationYiran Wang, Ben He, Xuanang Chen, Le Sun 0001. 4066-4077 [doi]

Generation-Augmented and Embedding Fusion in Document-Level Event Argument ExtractionXingjian Lin, Shengfei Lyu, Xin Wang, Qiuju Chen, Huanhuan Chen. 4078-4084 [doi]

C3LRSO: A Chinese Corpus for Complex Logical Reasoning in Sentence OrderingXiaotao Guo, Jiang Li, Xiangdong Su, Fujun Zhang. 4085-4095 [doi]

KIA: Knowledge-Guided Implicit Vision-Language Alignment for Chest X-Ray Report GenerationHeng Yin, Shanlin Zhou, Pandong Wang, Zirui Wu, Yongtao Hao. 4096-4108 [doi]

On the Human-level Performance of Visual Question AnsweringChenlian Zhou, Guanyi Chen, Xin Bai, Ming Dong. 4109-4113 [doi]

Representing the Under-Represented: Cultural and Core Capability Benchmarks for Developing Thai Large Language ModelsDahyun Kim 0001, Sukyung Lee, Yungi Kim, Attapol Rutherford, Chanjun Park. 4114-4129 [doi]

CONTRANS: Weak-to-Strong Alignment Engineering via Concept TransplantationWeilong Dong, Xinwei Wu, Renren Jin, Shaoyang Xu, Deyi Xiong. 4130-4148 [doi]

Idea23D: Collaborative LMM Agents Enable 3D Model Generation from Interleaved Multimodal InputsJunhao Chen, Xiang Li, Xiaojun Ye, Chao Li, Zhaoxin Fan, Hao Zhao. 4149-4166 [doi]

Learning from Impairment: Leveraging Insights from Clinical Linguistics in Language Modelling ResearchDominique Brunato. 4167-4174 [doi]

Efficient Cross-modal Prompt Learning with Semantic Enhancement for Domain-robust Fake News DetectionFei Wu 0004, Hao Jin, Changhui Hu, Yimu Ji 0001, Xiao-Yuan Jing, Guo-Ping Jiang. 4175-4185 [doi]

AraDiCE: Benchmarks for Dialectal and Cultural Capabilities in LLMsBasel Mousi, Nadir Durrani, Fatema Ahmad, Md. Arid Hasan, Maram Hasanain, Tameem Kabbani, Fahim Dalvi, Shammur Absar Chowdhury, Firoj Alam. 4186-4218 [doi]

Distance-Adaptive Quaternion Knowledge Graph Embedding with Bidirectional RotationWeihua Wang, Qiuyu Liang, Feilong Bao, Guanglai Gao. 4219-4231 [doi]

How Credible Is an Answer From Retrieval-Augmented LLMs? Investigation and Evaluation With Multi-Hop QAYujia Zhou 0002, Zheng Liu 0011, Zhicheng Dou. 4232-4242 [doi]

Is Parameter Collision Hindering Continual Learning in LLMs?Shuo Yang, Kun-Peng Ning, Yu-Yang Liu, Jia-Yu Yao, Yong-Hong Tian 0001, Yi-Bing Song, Li Yuan 0007. 4243-4259 [doi]

Jump To Hyperspace: Comparing Euclidean and Hyperbolic Loss Functions for Hierarchical Multi-Label Text ClassificationJens Van Nooten, Walter Daelemans. 4260-4273 [doi]

Exploring the Limitations of Detecting Machine-Generated TextJad Doughman, Osama Mohammed Afzal, Hawau Olamide Toyin, Shady Shehata, Preslav Nakov, Zeerak Talat. 4274-4281 [doi]

Boosting Text-to-SQL through Multi-grained Error IdentificationBo Xu 0023, Shufei Li, Hongyu Jing, Ming Du, Hui Song, Hongya Wang, Yanghua Xiao. 4282-4292 [doi]

Know When to Fuse: Investigating Non-English Hybrid Retrieval in the Legal DomainAntoine Louis, Gijs van Dijck, Gerasimos Spanakis. 4293-4312 [doi]

MPID: A Modality-Preserving and Interaction-Driven Fusion Network for Multimodal Sentiment AnalysisTianyi Li, Daming Liu. 4313-4322 [doi]

Towards Efficient and Robust VQA-NLE Data Generation with Large Vision-Language ModelsPatrick Amadeus Irawan, Genta Indra Winata, Samuel Cahyawijaya, Ayu Purwarianti. 4323-4340 [doi]

DefVerify: Do Hate Speech Models Reflect Their Dataset's Definition?Urja Khurana, Eric T. Nalisnick, Antske Fokkens. 4341-4358 [doi]

Fusion meets Function: The Adaptive Selection-Generation Approach in Event Argument ExtractionGuoxuan Ding, Xiaobo Guo, Xin Wang, Lei Wang, Tianshu Fu, Nan Mu, Daren Zha. 4359-4369 [doi]

ColBERT-XM: A Modular Multi-Vector Representation Model for Zero-Shot Multilingual Information RetrievalAntoine Louis, Vageesh Kumar Saxena, Gijs van Dijck, Gerasimos Spanakis. 4370-4383 [doi]

TEXT-CAKE: Challenging Language Models on Local Text CoherenceLuca Dini, Dominique Brunato, Felice dell'Orletta, Tommaso Caselli. 4384-4398 [doi]

KVFKT: A New Horizon in Knowledge Tracing with Attention-Based Embedding and Forgetting Curve IntegrationQuanlong Guan, Xiuliang Duan, Kaiquan Bian, Guanliang Chen, Jianbo Huang, Zhiguo Gong, Liangda Fang. 4399-4409 [doi]

Fine-tuning Large Language Models for Improving Factuality in Legal Question AnsweringYinghao Hu, Leilei Gan, Wenyi Xiao, Kun Kuang, Fei Wu 0001. 4410-4427 [doi]

Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path ReasoningXiaoye Qu, Jiashuo Sun, Wei Wei 0002, Daizong Liu, Jianfeng Dong, Yu Cheng 0001. 4428-4441 [doi]

Large Language Models are good multi-lingual learners : When LLMs meet cross-lingual promptsTeng Wang, Zhenqi He, Wing Yin Yu, Xiaojin Fu, Xiongwei Han. 4442-4456 [doi]

MLaKE: Multilingual Knowledge Editing Benchmark for Large Language ModelsZihao Wei, Jingcheng Deng, Liang Pang, Hanxing Ding, Huawei Shen, Xueqi Cheng. 4457-4473 [doi]

Factual Dialogue Summarization via Learning from Large Language ModelsRongxin Zhu, Jey Han Lau, Jianzhong Qi 0001. 4474-4492 [doi]

QUENCH: Measuring the gap between Indic and Non-Indic Contextual General Reasoning in LLMsMohammad Aflah Khan, Neemesh Yadav, Sarah Masud, Md. Shad Akhtar. 4493-4509 [doi]

GroUSE: A Benchmark to Evaluate Evaluators in Grounded Question AnsweringSacha Muller, António Loison, Bilel Omrani, Gautier Viaud. 4510-4534 [doi]

Exploiting the Index Gradients for Optimization-Based Jailbreaking on Large Language ModelsJiahui Li, Yongchang Hao, Haoyu Xu, Xing Wang, Yu Hong. 4535-4547 [doi]

Conditional Semantic Textual Similarity via Conditional Contrastive LearningXinyue Liu, Zeyang Qin, Zeyu Wang, Wenxin Liang, Linlin Zong, Bo Xu. 4548-4560 [doi]

A Survey of Code-switched Arabic NLP: Progress, Challenges, and Future DirectionsInjy Hamed, Caroline Sabty, Slim Abdennadher, Ngoc Thang Vu, Thamar Solorio, Nizar Habash. 4561-4585 [doi]

Towards Database-Free Text-to-SQL Evaluation: A Graph-Based Metric for Functional CorrectnessYi Zhan, Longjie Cui, Han Weng, Guifeng Wang, Yu Tian, Boyi Liu, Yingxiang Yang, Xiaoming Yin, Jiajun Xie, Yang Sun. 4586-4610 [doi]

Modal Feature Optimization Network with Prompt for Multimodal Sentiment AnalysisXiangmin Zhang, Wei Wei, Shihao Zou. 4611-4621 [doi]

Multimodal Fact-Checking with Vision Language Models: A Probing Classifier based Solution with Embedding StrategiesRecep Firat Cekinel, Pinar Karagoz, Çagri Çöltekin. 4622-4633 [doi]

Faithful Inference Chains Extraction for Fact Verification over Multi-view Heterogeneous Graph with Causal InterventionDaoqi Chen, Yaxin Li 0007, Zizhong Zhu, Xiaowang Zhang, Zhiyong Feng 0002. 4634-4645 [doi]

SweetieChat: A Strategy-Enhanced Role-playing Framework for Diverse Scenarios Handling Emotional Support AgentJing Ye, Lu Xiang, Yaping Zhang, Chengqing Zong. 4646-4669 [doi]

ELAINE-medLLM: Lightweight English Japanese Chinese Trilingual Large Language Model for Bio-medical DomainKen Yano, Zheheng Luo, Jimin Huang, Qianqian Xie, Masaki Asada, Chenhan Yuan, Kailai Yang, Makoto Miwa, Sophia Ananiadou, Jun'ichi Tsujii. 4670-4688 [doi]

Debate-to-Write: A Persona-Driven Multi-Agent Framework for Diverse Argument GenerationZhe Hu, Hou Pong Chan, Jing Li, Yu Yin 0001. 4689-4703 [doi]

Data Quality Enhancement on the Basis of Diversity with Large Language Models for Text Classification: Uncovered, Difficult, and NoisyMin Zeng, Caiquan Liu, ShiQi Zhang, Li Xie, Chen Sang, Xiaoxin Chen. 4704-4714 [doi]

Slender-Mamba: Fully Quantized Mamba in 1.58 Bits From Head to ToeZhenxuan Yu, Takeshi Kojima, Yutaka Matsuo, Yusuke Iwasawa. 4715-4724 [doi]

What's the most important value? INVP: INvestigating the Value Priorities of LLMs through Decision-making in Social ScenariosXuelin Liu, Pengyuan Liu, Dong Yu. 4725-4752 [doi]

BasqBBQ: A QA Benchmark for Assessing Social Biases in LLMs for Basque, a Low-Resource LanguageXabier Saralegi, Muitze Zulaika. 4753-4767 [doi]

DynRank: Improve Passage Retrieval with Dynamic Zero-Shot Prompting Based on Question ClassificationAbdelrahman Abdallah, Jamshid Mozafari, Bhawna Piryani, Mohammed M. Abdelgwad, Adam Jatowt. 4768-4778 [doi]

Why should only High-Resource-Languages have all the fun? Pivot Based Evaluation in Low Resource SettingAnanya Mukherjee, Saumitra Yadav, Manish Shrivastava 0001. 4779-4788 [doi]

The Shift from Logic to Dialectic in Argumentation Theory: Implications for Computational Argument Quality AssessmentRositsa V. Ivanova, Reto Gubelmann. 4789-4802 [doi]

Task-Oriented Dialog Systems for the Senegalese Wolof LanguageDerguene Mbaye, Moussa Diallo. 4803-4812 [doi]

Disentangling Preference Representation and Text Generation for Efficient Individual Preference AlignmentJianfei Zhang, Jun Bai, Bei Li, Yanmeng Wang, Rumei Li, Chenghua Lin, Wenge Rong. 4813-4839 [doi]

A Survey of Generative Information ExtractionZikang Zhang, Wangjie You, Tianci Wu, Xinrui Wang, Juntao Li, Min Zhang 0005. 4840-4870 [doi]

Interactive Evaluation for Medical LLMs via Task-oriented Dialogue SystemRuoyu Liu, Kui Xue, Xiaofan Zhang 0002, Shaoting Zhang 0001. 4871-4896 [doi]

Breaking the Stage Barrier: A Novel Single-Stage Approach to Long Context Extension for Large Language ModelsHaoran Lian, Junmin Chen, Wei Huang, Yizhe Xiong, Wenping Hu, Guiguang Ding, Hui Chen 0013, Jianwei Niu, Zijia Lin, Fuzheng Zhang, Di Zhang. 4897-4909 [doi]

ACL-rlg: A Dataset for Reading List GenerationJulien Aubert-Béduchaud, Florian Boudin, Béatrice Daille, Richard Dufour. 4910-4919 [doi]

SEED: Accelerating Reasoning Tree Construction via Scheduled Speculative DecodingZhenglin Wang, Jialong Wu 0007, Yilong Lai, Congzhi Zhang, Deyu Zhou. 4920-4937 [doi]

Extracting structure from an LLM - how to improve on surprisal-based models of Human Language ProcessingDaphne P. Wang, Mehrnoosh Sadrzadeh, Milos Stanojevic, Wing-Yee Chow, Richard Breheny. 4938-4944 [doi]

Evaluating Generalization Capability of Language Models across Abductive, Deductive and Inductive Logical ReasoningYu Sheng, Wanting Wen, Linjing Li, Daniel Zeng 0001. 4945-4957 [doi]

Measuring the Robustness of Reference-Free Dialogue Evaluation SystemsJustin Vasselli, Adam Nohejl, Taro Watanabe. 4958-4972 [doi]

Towards Robust Comparisons of NLP Models: A Case StudyVicente Iván Sánchez Carmona, Shanshan Jiang, Bin Dong 0003. 4973-4979 [doi]

SILC-EFSA: Self-aware In-context Learning Correction for Entity-level Financial Sentiment AnalysisSenbin Zhu, Chenyuan He, Hongde Liu, Pengcheng Dong, Hanjie Zhao, Yuchen Yan, Yuxiang Jia, Hongying Zan, Min Peng. 4980-4992 [doi]

Enhancing Criminal Investigation Analysis with Summarization and Memory-based Retrieval-Augmented Generation: A Comprehensive Evaluation of Real Case DataMads Skipanes, Tollef Emil Jørgensen, Kyle Porter, Gianluca Demartini, Sule Yildirim Yayilgan. 4993-5010 [doi]

Attention-Seeker: Dynamic Self-Attention Scoring for Unsupervised Keyphrase ExtractionErwin Daniel López Zapata, Cheng Tang, Atsushi Shimada. 5011-5026 [doi]

Evaluating Open-Source ASR Systems: Performance Across Diverse Audio Conditions and Error Correction MethodsSaki Imai, Tahiya Chowdhury, Amanda J. Stent. 5027-5039 [doi]

Large Language Models as an Indirect Reasoner: Contrapositive and Contradiction for Automated ReasoningYanfang Zhang, Yiliu Sun, Yibing Zhan, Dapeng Tao, Dacheng Tao, Chen Gong 0002. 5040-5057 [doi]

Towards Data Contamination Detection for Modern Large Language Models: Limitations, Inconsistencies, and Oracle ChallengesVinay Samuel, Yue Zhou, Henry Peng Zou. 5058-5070 [doi]

Can Large Language Models Understand You Better? An MBTI Personality Detection Dataset Aligned with Population TraitsBohan Li, Jiannan Guan, Longxu Dou, Yunlong Feng, Dingzirui Wang, Yang Xu 0049, Enbo Wang, Qiguang Chen, Bichen Wang, Xiao Xu 0005, Yimeng Zhang, Libo Qin 0001, Yanyan Zhao, Qingfu Zhu, Wanxiang Che. 5071-5081 [doi]

TMATH A Dataset for Evaluating Large Language Models in Generating Educational Hints for Math Word ProblemsChangyong Qi, Yuang Wei, Haoxin Xu, Longwei Zheng, Peiji Chen, Xiaoqing Gu. 5082-5093 [doi]

A Benchmark of French ASR Systems Based on Error SeverityAntoine Tholly, Jane Wottawa, Mickael Rouvier, Richard Dufour. 5094-5101 [doi]

What Makes Cryptic Crosswords Challenging for LLMs?Abdelrahman Boda Sadallah, Daria Kotova, Ekaterina Kochmar. 5102-5114 [doi]

Improving the Efficiency of Visually Augmented Language ModelsPaula Ontalvilla, Aitor Ormazabal, Gorka Azkune. 5115-5122 [doi]

Refer to the Reference: Reference-focused Synthetic Automatic Post-Editing Data GenerationSourabh Dattatray Deoghare, Diptesh Kanojia, Pushpak Bhattacharyya. 5123-5135 [doi]

EvoPrompt: Evolving Prompts for Enhanced Zero-Shot Named Entity Recognition with Large Language ModelsZeliang Tong, Zhuojun Ding, Wei Wei 0002. 5136-5153 [doi]

MIT-10M: A Large Scale Parallel Corpus of Multilingual Image TranslationBo Li, ShaoLin Zhu, Lijie Wen. 5154-5167 [doi]

Synthetic Paths to Integral Truth: Mitigating Hallucinations Caused by Confirmation Bias with Synthetic DataChangwon Ok, Eunkyeong Lee, Dongsuk Oh. 5168-5180 [doi]

Unlike "Likely", "Unlike" is Unlikely: BPE-based Segmentation hurts Morphological Derivations in LLMsPaul Lerner, François Yvon. 5181-5190 [doi]

WIKIGENBENCH: Exploring Full-length Wikipedia Generation under Real-World ScenarioJiebin Zhang, Eugene J. Yu, Qinyu Chen, Chenhao Xiong, Dawei Zhu, Han Qian, Mingbo Song, Weimin Xiong, Xiaoguang Li, Qun Liu 0001, Sujian Li. 5191-5210 [doi]

LLMs meet Bloom's Taxonomy: A Cognitive View on Large Language Model EvaluationsThomas Huber, Christina Niklaus. 5211-5246 [doi]

Exploring Fine-Grained Human Motion Video CaptioningBingchan Zhao, Xinyi Liu, Zhuocheng Yu, Tongchen Yang, Yifan Song, Mingyu Jin, Sujian Li, Yizhou Wang. 5247-5264 [doi]

DiffStyleTTS: Diffusion-based Hierarchical Prosody Modeling for Text-to-Speech with Diverse and Controllable StylesJiaxuan Liu, Zhaoci Liu, Yajun Hu, Yingying Gao, Shilei Zhang, Zhenhua Ling. 5265-5272 [doi]

OpenForecast: A Large-Scale Open-Ended Event Forecasting DatasetZhen Wang, Xi Zhou, Yating Yang, Bo Ma, Lei Wang, Rui Dong, Azmat Anwar. 5273-5294 [doi]

A Knowledge Graph Reasoning-Based Model for Computerized Adaptive TestingXinyi Qiu, Zhiyun Chen. 5295-5304 [doi]

TOOL-ED: Enhancing Empathetic Response Generation with the Tool Calling Capability of LLMHuiying Cao, Yiqun Zhang, Shi Feng 0001, Xiaocui Yang, Daling Wang, Yifei Zhang 0003. 5305-5320 [doi]

Annotating the French Wiktionary with supersenses for large scale lexical analysis: a use case to assess form-meaning relationships within the nominal lexiconNicolas Angleraud, Lucie Barque, Marie Candito. 5321-5332 [doi]

When Evolution Strategy Meets Language Models TuningBo Huang, Yuxin Jiang, Mingyang Chen, Yi Wang 0017, Hongyang Chen, Wei Wang 0011. 5333-5344 [doi]

Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive AnalysisWeitao Ma, Xiaocheng Feng, Weihong Zhong, Lei Huang 0021, Yangfan Ye, Xiachong Feng, Bing Qin 0001. 5345-5363 [doi]

Knowledge Graph Pooling and Unpooling for Concept AbstractionJuan Li 0010, Wen Zhang 0015, Zhiqiang Liu, Mingchen Tu, Mingyang Chen, Ningyu Zhang 0001, Shijian Li. 5364-5374 [doi]

Do LLMs Play Dice? Exploring Probability Distribution Sampling in Large Language Models for Behavioral SimulationJia Gu, Liang Pang, Huawei Shen, Xueqi Cheng. 5375-5390 [doi]

Pseudo-label Data Construction Method and Syntax-enhanced Model for Chinese Semantic Error RecognitionHongyan Wu, Nankai Lin, Shengyi Jiang, Lianxi Wang 0001, Aimin Yang. 5391-5402 [doi]

An Active Learning Framework for Inclusive Generation by Large Language ModelsSabit Hassan, Anthony B. Sicilia, Malihe Alikhani. 5403-5414 [doi]

Multimodal Extraction and Recognition of Arabic Implicit Discourse RelationsAhmed Ruby, Christian Hardmeier, Sara Stymne. 5415-5429 [doi]

Post-Hoc Watermarking for Robust Detection in Text Generated by Large Language ModelsJifei Hao, Jipeng Qiang, Yi Zhu 0006, Yun Li 0010, Yunhao Yuan 0001, Xiaoye Ouyang. 5430-5442 [doi]

RA-MTR: A Retrieval Augmented Multi-Task Reader based Approach for Inspirational Quote Extraction from Long DocumentsSayantan Adak, Animesh Mukherjee 0001. 5443-5462 [doi]

VeritasQA: A Truthfulness Benchmark Aimed at Multilingual TransferabilityJavier Aula-Blasco, Júlia Falcão, Susana Sotelo, Silvia Paniagua, Aitor Gonzalez-Agirre, Marta Villegas. 5463-5474 [doi]

ECC: Synergizing Emotion, Cause and Commonsense for Empathetic Dialogue GenerationXu Wang, Bo Wang, Yihong Tang, Dongming Zhao, Jing Liu, Ruifang He, Yuexian Hou. 5475-5485 [doi]

GraphOTTER: Evolving LLM-based Graph Reasoning for Complex Table Question AnsweringQianlong Li, Chen Huang, Shuai Li, Yuanxin Xiang, Deng Xiong, Wenqiang Lei. 5486-5506 [doi]

Persona-Consistent Dialogue Generation via Pseudo Preference TuningJunya Takayama, Masaya Ohagi, Tomoya Mizumoto, Katsumasa Yoshikawa. 5507-5514 [doi]

Montague semantics and modifier consistency measurement in neural language modelsDanilo Silva de Carvalho, Edoardo Manino, Julia Rozanova, Lucas C. Cordeiro, André Freitas. 5515-5529 [doi]

LoRA-drop: Efficient LoRA Parameter Pruning based on Output EvaluationHongyun Zhou, Xiangyu Lu, Wang Xu, Conghui Zhu, Tiejun Zhao, Muyun Yang. 5530-5543 [doi]

Leveraging Language-based Representations for Better Solving Symbol-related Problems with Large Language ModelsYile Wang 0001, Sijie Cheng, Zixin Sun, Peng Li, Yang Liu 0005. 5544-5557 [doi]

Towards Cross-Lingual Audio Abuse Detection in Low-Resource Settings with Few-Shot LearningAditya Narayan Sankaran, Reza Farahbakhsh, Noël Crespi. 5558-5569 [doi]

MQM-APE: Toward High-Quality Error Annotation Predictors with Automatic Post-Editing in LLM Translation EvaluatorsQingyu Lu, Liang Ding 0006, Kanjian Zhang, Jinxia Zhang, Dacheng Tao. 5570-5587 [doi]

MOPO: Multi-Objective Prompt Optimization for Affective Text GenerationYarik Menchaca Resendiz, Roman Klinger. 5588-5606 [doi]

PropaInsight: Toward Deeper Understanding of Propaganda in Terms of Techniques, Appeals, and IntentJiateng Liu, Lin Ai, Zizhou Liu, Payam Karisani, Zheng Hui, Yi Fung 0001, Preslav Nakov, Julia Hirschberg, Heng Ji. 5607-5628 [doi]

MQA-KEAL: Multi-hop Question Answering under Knowledge Editing for Arabic LanguageMuhammad Asif Ali, Nawal Daftardar, Mutayyaba Waheed, Jianbin Qin, Di Wang 0015. 5629-5644 [doi]

A Novel Negative Sample Generation Method for Contrastive Learning in Hierarchical Text ClassificationJuncheng Zhou, Lijuan Zhang 0004, Yachen He, Rongli Fan, Lei Zhang 0196, Jian Wan 0001. 5645-5655 [doi]

Edge-free but Structure-aware: Prototype-Guided Knowledge Distillation from GNNs to MLPsTaiqiang Wu, Zhe Zhao 0006, Jiahao Wang, Xingyu Bai, Lei Wang, Ngai Wong, Yujiu Yang. 5656-5667 [doi]

A Context-Aware Approach for Enhancing Data Imputation with Pre-trained Language ModelsAhatsham Hayat, Mohammad Rashedul Hasan. 5668-5685 [doi]

Using Game Play to Investigate Multimodal and Conversational Grounding in Large Multimodal ModelsSherzod Hakimov, Yerkezhan Abdullayeva, Kushal Koshti, Antonia Schmidt, Yan Weiser, Anne Beyer, David Schlangen. 5686-5718 [doi]

PADO: Personality-induced multi-Agents for Detecting OCEAN in human-generated textsHaein Yeo, Taehyeong Noh, Seungwan Jin, Kyungsik Han. 5719-5736 [doi]

Rethinking Kullback-Leibler Divergence in Knowledge Distillation for Large Language ModelsTaiqiang Wu, Chaofan Tao, Jiahao Wang, Runming Yang, Zhe Zhao 0006, Ngai Wong. 5737-5755 [doi]

Mix-of-Granularity: Optimize the Chunking Granularity for Retrieval-Augmented GenerationZijie Zhong, Hanwen Liu, Xiaoya Cui, Xiaofan Zhang, Zengchang Qin. 5756-5774 [doi]

Multilingual Knowledge Editing with Language-Agnostic Factual NeuronsXue Zhang, Yunlong Liang, Fandong Meng, Songming Zhang, Yufeng Chen 0005, Jinan Xu, Jie Zhou 0016. 5775-5788 [doi]

MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQLXuanliang Zhang, Dingzirui Wang, Longxu Dou, Qingfu Zhu, Wanxiang Che. 5789-5806 [doi]

Uchaguzi-2022: A Dataset of Citizen Reports on the 2022 Kenyan ElectionRoberto Mondini, Neema Kotonya, Robert L. Logan IV, Elizabeth M. Olson, Angela Oduor Lungati, Daniel Duke Odongo, Tim Ombasa, Hemank Lamba, Aoife Cahill, Joel R. Tetreault, Alejandro Jaimes. 5807-5825 [doi]

On Evaluating LLMs' Capabilities as Functional Approximators: A Bayesian Evaluation FrameworkShoaib Ahmed Siddiqui, Yanzhi Chen, Juyeon Heo, Menglin Xia, Adrian Weller. 5826-5835 [doi]

Biases in Large Language Model-Elicited Text: A Case Study in Natural Language InferenceGrace Proebsting, Adam Poliak. 5836-5851 [doi]

LLMs May Perform MCQA by Selecting the Least Incorrect OptionHaochun Wang, Sendong Zhao, Zewen Qiang, Nuwa Xi, Bing Qin 0001, Ting Liu 0001. 5852-5862 [doi]

Benchmark Creation for Aspect-Based Sentiment Analysis in Low-Resource Odia Language and Evaluation through Fine-Tuning of Multilingual ModelsLipika Dewangan, Zoyah Afsheen Sayeed, Chandresh Maurya. 5863-5869 [doi]

ADAPTIVE IE: Investigating the Complementarity of Human-AI Collaboration to Adaptively Extract Information on-the-flyIshani Mondal, Michelle Yuan, Anandhavelu Natarajan, Aparna Garimella, Francis Ferraro, Andrew Blair-Stanek, Benjamin Van Durme, Jordan Lee Boyd-Graber. 5870-5889 [doi]

DAEA: Enhancing Entity Alignment in Real-World Knowledge Graphs Through Multi-Source Domain AdaptationLinyan Yang, Shiqiao Zhou, Jingwei Cheng, Fu Zhang 0001, JiZheng Wan, Shuo Wang, Mark Lee. 5890-5901 [doi]

CoPrUS: Consistency Preserving Utterance Synthesis towards more realistic benchmark dialoguesSebastian Steindl, Ulrich Schäfer, Bernd Ludwig. 5902-5917 [doi]

JMedBench: A Benchmark for Evaluating Japanese Biomedical Large Language ModelsJunfeng Jiang, Jiahao Huang, Akiko Aizawa. 5918-5935 [doi]

Automated Detection of Tropes In Short TextsAlessandra Flaccavento, Youri Peskine, Paolo Papotti, Riccardo Torlone, Raphaël Troncy. 5936-5951 [doi]

WER We Stand: Benchmarking Urdu ASR ModelsSamee Arif, Aamina Jamal Khan, Mustafa Abbas, Agha Ali Raza, Awais Athar. 5952-5961 [doi]

CHIFRAUD: A Long-term Web Text Dataset for Chinese Fraud DetectionMin Tang, Lixin Zou, Zhe Jin, Shujie Cui, Shiuan-Ni Liang, Weiqing Wang. 5962-5974 [doi]

CateEA: Enhancing Entity Alignment via Implicit Category SupervisionGuan Dong Feng, Tao Ren, Jun Hu, Dan-Dan Wang. 5975-5986 [doi]

Egalitarian Language Representation in Language Models: It All Begins with TokenizersMenan Velayuthan, Kengatharaiyer Sarveswaran. 5987-5996 [doi]

PIRsuader: A Persuasive Chatbot for Mitigating Psychological Insulin Resistance in Type-2 Diabetic PatientsSujatha Das Gollapalli, See-Kiong Ng. 5997-6013 [doi]

Continual Learning Using Only Large Language Model PromptingJiabao Qiu, Zixuan Ke, Bing Liu 0001. 6014-6023 [doi]

Empirical Study on Data Attributes Insufficiency of Evaluation Benchmarks for LLMsChuang Liu, Renren Jin, Zheng Yao, Tianyi Li, Liang Cheng, Mark Steedman, Deyi Xiong. 6024-6038 [doi]

Small Language Models Also Work With Small Vocabularies: Probing the Linguistic Abilities of Grapheme- and Phoneme-Based Baby LlamasBastian Bunzeck, Daniel Duran 0001, Leonie Schade, Sina Zarrieß. 6039-6048 [doi]

Evaluating Readability Metrics for German Medical Text SimplificationKaren Scholz, Markus Wenzel 0003. 6049-6062 [doi]

Hi-GEC: Hindi Grammar Error Correction in Low Resource ScenarioUjjwal Sharma 0004, Pushpak Bhattacharyya. 6063-6075 [doi]

MuPe Life Stories Dataset: Spontaneous Speech in Brazilian Portuguese with a Case Study Evaluation on ASR Bias against Speakers Groups and Topic ModelingSidney Evaldo Leal, Arnaldo Cândido Júnior, Ricardo M. Marcacini, Edresson Casanova, Odilon Gonçalves, Anderson da Silva Soares, Rodrigo Freitas Lima, Lucas Rafael Stefanel Gris, Sandra M. Aluísio. 6076-6087 [doi]

Multi-Layered Evaluation Using a Fusion of Metrics and LLMs as Judges in Open-Domain Question AnsweringRashin Rahnamoun, Mehrnoush Shamsfard. 6088-6104 [doi]

BERT-based Classical Arabic Poetry Authorship AttributionLama Alqurashi, Serge Sharoff, Janet Watson, Jacob Blakesley. 6105-6119 [doi]

It's What You Say and How You Say It: Investigating the Effect of Linguistic vs. Behavioral Adaptation in Task-Oriented ChatbotsLindsey Vanderlyn, Ngoc Thang Vu. 6120-6149 [doi]

VLR-Bench: Multilingual Benchmark Dataset for Vision-Language Retrieval Augmented GenerationHyeonSeok Lim, Dongjae Shin, Seohyun Song, Inho Won, MinJun Kim, Junghun Yuk, Haneol Jang, Kyungtae Lim. 6150-6168 [doi]

LASS: A Novel and Economical Data Augmentation Framework Based on Language Models for Debiasing Opinion SummarizationYanyue Zhang, Pengfei Li, Yilong Lai, Yulan He 0001, Deyu Zhou. 6169-6183 [doi]

Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal ContaminationEva Sánchez-Salido, Roser Morante, Julio Gonzalo, Guillermo Marco, Jorge Carrillo-de-Albornoz, Laura Plaza, Enrique Amigó, Andrés Fernández García, Alejandro Benito-Santos, Adrián Ghajari Espinosa, Víctor Fresno. 6184-6200 [doi]

Multi-Modal Multi-Granularity Tokenizer for Chu Bamboo SlipsYingfa Chen, Chenlong Hu, Cong Feng, Chenyang Song, Shi Yu, Xu Han 0007, Zhiyuan Liu 0001, Maosong Sun 0001. 6201-6211 [doi]

DROWN: Towards Tighter LiRPA-based Robustness CertificationYunruo Zhang, Tianyu Du, Shouling Ji, Shanqing Guo. 6212-6229 [doi]

Large Language Models with Reinforcement Learning from Human Feedback Approach for Enhancing Explainable Sexism DetectionAli Riahi Samani, Tianhao Wang, Kangshuo Li, Feng Chen 0001. 6230-6243 [doi]

Leveraging Taxonomy and LLMs for Improved Multimodal Hierarchical ClassificationShijing Chen, Mohamed Reda Bouadjenek, Usman Naseem, Basem Suleiman, Shoaib Jameel, Flora D. Salim, Hakim Hacid, Imran Razzak. 6244-6254 [doi]

Representation Purification for End-to-End Speech TranslationChengwei Zhang, Yue Zhou, Rui Zhao, Yidong Chen 0001, Xiaodong Shi. 6255-6269 [doi]

Semi-Automated Construction of Sense-Annotated Datasets for Practically Any LanguageJai Riley, Bradley M. Hauer, Nafisa Sadaf Hriti, Guoqing Luo, Amirreza Mirzaei, Ali Rafiei, Hadi Sheikhi, Mahvash Siavashpour, Mohammad Tavakoli, Ning Shi, Grzegorz Kondrak. 6270-6284 [doi]

HYDEN: Hyperbolic Density Representations for Medical Images and ReportsZhi Qiao, Linbin Han, Xiantong Zhen, Jia-Hong Gao, Zhen Qian. 6285-6297 [doi]

Towards Human Understanding of Paraphrase Types in Large Language ModelsDominik Meier, Jan Philip Wahle, Terry Lima Ruas, Bela Gipp. 6298-6316 [doi]

Just Read the Codebook! Make Use of Quality Codebooks in Zero-Shot Classification of Multilabel Frame DatasetsMattes Ruckdeschel. 6317-6337 [doi]

NLP for preserving Torlak, a vulnerable low-resource Slavic languageLi Tang, Teodora Vukovic. 6338-6347 [doi]

Analyzing the Attention Heads for Pronoun Disambiguation in Context-aware Machine Translation ModelsPawel Maka, Yusuf Can Semerci, Jan Scholtes, Gerasimos Spanakis. 6348-6377 [doi]

ModaFact: Multi-paradigm Evaluation for Joint Event Modality and Factuality DetectionMarco Rovera, Serena Cristoforetti, Sara Tonelli. 6378-6396 [doi]

Why Does ChatGPT "Delve" So Much? Exploring the Sources of Lexical Overrepresentation in Large Language ModelsTom S. Juzek, Zina B. Ward. 6397-6411 [doi]

Evaluating Pixel Language Models on Non-Standardized LanguagesAlberto Muñoz-Ortiz, Verena Blaschke, Barbara Plank. 6412-6419 [doi]

LOLA - An Open-Source Massively Multilingual Large Language ModelNikit Srivastava, Denis Kuchelev, Tatiana Moteu Ngoli, Kshitij Shetty, Michael Röder, Hamada M. Zahera, Diego Moussallem, Axel-Cyrille Ngonga Ngomo. 6420-6446 [doi]

Cross-Lingual Sentence Compression for Length-Constrained Subtitles in Low-Resource SettingsTollef Emil Jørgensen, Ole Jakob Mengshoel. 6447-6458 [doi]

SynDARin: Synthesising Datasets for Automated Reasoning in Low-Resource LanguagesGayane Ghazaryan, Erik Arakelyan, Isabelle Augenstein, Pasquale Minervini. 6459-6466 [doi]

Part-Of-Speech Sensitivity of Routers in Mixture of Experts ModelsElie Antoine, Frédéric Béchet, Philippe Langlais. 6467-6474 [doi]

Tougher Text, Smarter Models: Raising the Bar for Adversarial Defence BenchmarksYang Wang, Chenghua Lin. 6475-6491 [doi]

Acquired TASTE: Multimodal Stance Detection with Textual and Structural EmbeddingsGuy Barel, Oren Tsur, Dan Vilenchik. 6492-6504 [doi]

IRUEX: A Study on Large Language Models Problem-Solving Skills in Iran's University Entrance ExamHamed Khademi Khaledi, Heshaam Faili. 6505-6519 [doi]

data2lang2vec: Data Driven Typological Features CompletionHamidreza Amirzadeh, Sadegh Jafari, Anika Harju, Rob van der Goot. 6520-6529 [doi]

Explanation Regularisation through the Lens of AttributionsPedro Ferreira, Ivan Titov, Wilker Aziz. 6530-6551 [doi]

Small Language Models can Outperform Humans in Short Creative Writing: A Study Comparing SLMs with Humans and LLMsGuillermo Marco, Luz Rello, Julio Gonzalo. 6552-6570 [doi]

Generics are puzzling. Can language models find the missing piece?Gustavo Cilleruelo Calderón, Emily Allaway, Barry Haddow, Alexandra Birch. 6571-6588 [doi]

Entropy Guided Extrapolative Decoding to Improve Factuality in Large Language ModelsSouvik Das, Lifeng Jin, Linfeng Song, Haitao Mi, Baolin Peng, Dong Yu. 6589-6600 [doi]

Iterative Structured Knowledge Distillation: Optimizing Language Models Through Layer-by-Layer DistillationMalthe Have Musaeus, Rob van der Goot. 6601-6606 [doi]

Why do language models perform worse for morphologically complex languages?Catherine Arnett, Benjamin Bergen 0001. 6607-6623 [doi]

Argument Mining with Fine-Tuned Large Language ModelsJérémie Cabessa, Hugo Hernault, Umer Mushtaq. 6624-6635 [doi]

Beyond Surprisal: A Dual Metric Framework for Lexical Skill Acquisition in LLMsNazanin Shafiabadi, Guillaume Wisniewski. 6636-6641 [doi]

RUAccent: Advanced System for Stress Placement in Russian with Homograph ResolutionDenis Andreevich Petrov. 6642-6648 [doi]

On the Effects of Fine-tuning Language Models for Text-Based Reinforcement LearningMaurício Gruppi, Soham Dan, Keerthiram Murugesan, Subhajit Chaudhury. 6649-6658 [doi]

HateBRXplain: A Benchmark Dataset with Human-Annotated Rationales for Explainable Hate Speech Detection in Brazilian PortugueseIsadora Salles, Francielle Vargas, Fabrício Benevenuto. 6659-6669 [doi]

LLM4RE: A Data-centric Feasibility Study for Relation ExtractionAnushka Swarup, Tianyu Pan, Ronald Wilson, Avanti Bhandarkar, Damon L. Woodard. 6670-6691 [doi]

Automatic Extraction of Metaphoric Analogies from Literary Texts: Task Formulation, Dataset Construction, and EvaluationJoanne Boisson, Zara Siddique, Hsuvas Borkakoty, Dimosthenis Antypas, Luis Espinosa Anke, José Camacho-Collados. 6692-6704 [doi]

Enhancing Retrieval-Augmented Generation: A Study of Best PracticesSiran Li, Linus Stenzel, Carsten Eickhoff, Seyed Ali Bahrainian. 6705-6717 [doi]

From Prejudice to Parity: A New Approach to Debiasing Large Language Model Word EmbeddingsAishik Rakshit, Smriti Singh, Shuvam Keshari, Arijit Ghosh Chowdhury, Vinija Jain, Aman Chadha. 6718-6747 [doi]

LaERC-S: Improving LLM-based Emotion Recognition in Conversation with Speaker CharacteristicsYumeng Fu, Junjie Wu, Zhongjie Wang, Meishan Zhang, Lili Shan, Yulin Wu, Bingquan Liu. 6748-6761 [doi]

Analysing Zero-Shot Readability-Controlled Sentence SimplificationAbdullah Barayan, José Camacho-Collados, Fernando Alva-Manchego. 6762-6781 [doi]

The Invalsi Benchmarks: measuring the Linguistic and Mathematical understanding of Large Language Models in ItalianGiovanni Puccetti 0002, Maria Cassese, Andrea Esuli. 6782-6797 [doi]

RRHF-V: Ranking Responses to Mitigate Hallucinations in Multimodal Large Language Models with Human FeedbackGuoqing Chen, Fu Zhang, Jinghao Lin, Chenglong Lu, Jingwei Cheng. 6798-6815 [doi]

Speech Foundation Models and Crowdsourcing for Efficient, High-Quality Data CollectionBeomseok Lee, Marco Gaido, Ioan Calapodescu, Laurent Besacier, Matteo Negri. 6816-6826 [doi]

Improving Accessibility of SCOTUS Opinions: A Benchmark Study and a New Dataset for Generic Heading Prediction and Specific Heading GenerationMalek Yaich, Nicolas Hernandez. 6827-6839 [doi]

SelfPrompt: Autonomously Evaluating LLM Robustness via Domain-Constrained Knowledge Guidelines and Refined Adversarial PromptsAihua Pei, Zehua Yang, Shunan Zhu, Ruoxi Cheng, Ju Jia. 6840-6854 [doi]

GLoCIM: Global-view Long Chain Interest Modeling for news recommendationZhen Yang, Wenhui Wang, Tao Qi, Peng Zhang, Tianyun Zhang, Ru Zhang, Jianyi Liu, Yongfeng Huang. 6855-6865 [doi]

Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language ModelsXinyu Zhou, Delong Chen, Samuel Cahyawijaya, Xufeng Duan, Zhenguang G. Cai. 6866-6888 [doi]

MMD-ERE: Multi-Agent Multi-Sided Debate for Event Relation ExtractionYong Guan, Hao Peng 0015, Lei Hou 0001, Juanzi Li. 6889-6896 [doi]

Cross Domain Classification of Education Talk TurnsAchyutarama R. Ganti, Steven R. Wilson 0001, Wing-Yue Geoffrey Louie. 6897-6917 [doi]

Automated Molecular Concept Generation and Labeling with Large Language ModelsZimin Zhang, Qianli Wu, Botao Xia, Fang Sun, Ziniu Hu, Yizhou Sun, Shichang Zhang. 6918-6936 [doi]

URIEL+: Enhancing Linguistic Inclusion and Usability in a Typological and Multilingual Knowledge BaseAditya Armaan Khan, Mason Stephen Shipton, David Anugraha, Kaiyao Duan, Phuong H. Hoang, Eric Khiu, A. Seza Dogruöz, En-Shiun Annie Lee. 6937-6952 [doi]

A Framework for Effective Invocation Methods of Various LLM ServicesCan Wang, Dianbo Sui, Bolin Zhang, Xiaoyu Liu, Jiabao Kang, Zhidong Qiao, Zhiying Tu. 6953-6965 [doi]

DP-FROST: Differentially Private Fine-tuning of Pre-trained Models with Freezing Model ParametersDaeyoung Hong, Woohwan Jung, Kyuseok Shim. 6966-6984 [doi]

Evaluating LLMs' Capability to Identify Lexical Semantic Equivalence: Probing with the Word-in-Context TaskYoshihiko Hayashi. 6985-6998 [doi]

Close or Cloze? Assessing the Robustness of Large Language Models to Adversarial Perturbations via Word RecoveryLuke Moffett, Bhuwan Dhingra. 6999-7019 [doi]

NüshuRescue: Reviving the Endangered Nüshu Language with AIIvory Yang, Weicheng Ma, Soroush Vosoughi. 7020-7034 [doi]

TOP-Training: Target-Oriented Pretraining for Medical Extractive Question AnsweringSaptarshi Sengupta, Connor T. Heaton, Shreya Ghosh 0002, Wenpeng Yin 0001, Preslav Nakov, Suhang Wang. 7035-7054 [doi]

Beyond Discrete Personas: Personality Modeling Through Journal Intensive ConversationsSayantan Pal, Souvik Das, Rohini K. Srihari. 7055-7074 [doi]

Can We Afford The Perfect Prompt? Balancing Cost and Accuracy with the Economical Prompting IndexTyler McDonald, Anthony Colosimo, Yifeng Li, Ali Emami. 7075-7086 [doi]

From Priest to Doctor: Domain Adaptation for Low-Resource Neural Machine TranslationAli Marashian, Enora Rice, Luke Gessler, Alexis Palmer, Katharina von der Wense. 7087-7098 [doi]

Improving Relation Extraction by Sequence-to-sequence-based Dependency Parsing Pre-trainingMasaki Asada, Makoto Miwa. 7099-7105 [doi]

Exploring Language Model Generalization in Low-Resource Extractive QASaptarshi Sengupta, Wenpeng Yin 0001, Preslav Nakov, Shreya Ghosh 0002, Suhang Wang. 7106-7126 [doi]

Explain-Analyze-Generate: A Sequential Multi-Agent Collaboration Method for Complex ReasoningWenyuan Gu, Jiale Han, Haowen Wang, Xiang Li, Bo Cheng 0001. 7127-7140 [doi]

Towards Real-World Rumor Detection: Anomaly Detection Framework with Graph Supervised Contrastive LearningChaoqun Cui, Caiyan Jia. 7141-7155 [doi]

Addressing the Training-Inference Discrepancy in Discrete Diffusion for Text GenerationMasaki Asada, Makoto Miwa. 7156-7164 [doi]

Enhancing Rumor Detection Methods with Propagation Structure Infused Language ModelChaoqun Cui, Siyuan Li, Kunkun Ma, Caiyan Jia. 7165-7179 [doi]

EffiQA: Efficient Question-Answering with Strategic Multi-Model Collaboration on Knowledge GraphsZixuan Dong, Baoyun Peng, Yufei Wang, Jia Fu, Xiaodong Wang, Xin Zhou, Yongxue Shan, Kangchen Zhu, Weiguo Chen. 7180-7194 [doi]

Language Adaptation of Large Language Models: An Empirical Study on LLaMA2Shumin Wang, Yuexiang Xie, Bolin Ding, Jinyang Gao, Yanyong Zhang. 7195-7208 [doi]

Dialectal and Low Resource Machine Translation for AromanianAlexandru-Iulius Jerpelea, Alina-Stefania Radoi, Sergiu Nisioi. 7209-7228 [doi]

Fine-Grained Features-based Code Search for Precise Query-Code MatchingXinting Zhang, Mengqiu Cheng, Mengzhen Wang, Songwen Gong, Jiayuan Xie, Yi Cai, Qing Li. 7229-7238 [doi]

VideoQA-TA: Temporal-Aware Multi-Modal Video Question AnsweringZhixuan Wu, Bo Cheng, Jiale Han, Jiabao Ma, Shuhao Zhang, Yuli Chen, Changbo Li. 7239-7252 [doi]

Cross-lingual Social Misinformation Detector based on Hierarchical Mixture-of-Experts AdapterHaofang Fan, Xiran Hu, Geng Zhao. 7253-7265 [doi]

Unveiling Performance Challenges of Large Language Models in Low-Resource Healthcare: A Demographic Fairness PerspectiveYue Zhou, Barbara Di Eugenio, Lu Cheng. 7266-7278 [doi]

A Text Embedding Model with Contrastive Example Mining for Point-of-Interest GeocodingHibiki Nakatani, Hiroki Teranishi, Shohei Higashiyama, Yuya Sawada, Hiroki Ouchi, Taro Watanabe. 7279-7291 [doi]

In-context Continual Learning Assisted by an External Continual LearnerSaleh Momeni, Sahisnu Mazumder, Zixuan Ke, Bing Liu 0001. 7292-7306 [doi]

VaeDiff-DocRE: End-to-end Data Augmentation Framework for Document-level Relation ExtractionKhai Phan Tran, Wen-hua, Xue Li. 7307-7320 [doi]

Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme DetectionJinfa Huang, Jinsheng Pan, Zhongwei Wan, Hanjia Lyu, Jiebo Luo 0001. 7321-7330 [doi]

An Efficient Dialogue Policy Agent with Model-Based Causal Reinforcement LearningKai Xu, Zhenyu Wang, Yangyang Zhao, Bopeng Fang. 7331-7343 [doi]

Re-Cent: A Relation-Centric Framework for Joint Zero-Shot Relation Triplet ExtractionZehan Li, Fu Zhang, Kailun Lyu, Jingwei Cheng, Tianyue Peng. 7344-7354 [doi]

CoMIF: Modeling of Complex Multiple Interaction Factors for Conversation GenerationYuxuan Chen, Wei Wei, Shixuan Fan, Kaihe Xu, Dangyang Chen. 7355-7366 [doi]

Courtroom-LLM: A Legal-Inspired Multi-LLM Framework for Resolving Ambiguous Text ClassificationsSangkeun Jung, Jeesu Jung. 7367-7385 [doi]

RoleBreak: Character Hallucination as a Jailbreak Attack in Role-Playing SystemsYihong Tang, Bo Wang, Xu Wang, Dongming Zhao, Jing Liu, Ruifang He, Yuexian Hou. 7386-7402 [doi]

Enhancing Event Causality Identification with LLM Knowledge and Concept-Level Event RelationsYa Su, Hu Zhang 0003, Guangjun Zhang, Yujie Wang 0003, Yue Fan, Ru Li 0001, Yuanlong Wang. 7403-7414 [doi]

Cognate Detection for Historical Language Reconstruction of Proto-Sabean Languages: the Case of Ge'ez, Tigrinya, and AmharicElleni Sisay Temesgen, Hellina Hailu Nigatu, Fitsum Assamnew Andargie. 7415-7422 [doi]

Revisiting Cosine Similarity via Normalized ICA-transformed EmbeddingsHiroaki Yamagiwa, Momose Oyama, Hidetoshi Shimodaira. 7423-7452 [doi]

Piecing It All Together: Verifying Multi-Hop Multimodal ClaimsHaoran Wang, Aman Rangapur, Xiongxiao Xu, Yueqing Liang, Haroon Gharwi, Carl Yang, Kai Shu. 7453-7469 [doi]

Boosting the Capabilities of Compact Models in Low-Data Contexts with Large Language Models and Retrieval-Augmented GenerationBhargav Shandilya, Alexis Palmer. 7470-7483 [doi]

Large Language Model-Based Event Relation Extraction with RationalesZhilei Hu, Zixuan Li, Xiaolong Jin, Long Bai 0002, Jiafeng Guo, Xueqi Cheng. 7484-7496 [doi]

Charting the Future: Using Chart Question-Answering for Scalable Evaluation of LLM-Driven Data VisualizationsJames Ford, Xingmeng Zhao, Daniel Schumacher, Anthony Rios. 7497-7510 [doi]

Prompting Large Language Models to Tackle the Full Software Development Lifecycle: A Case StudyBowen Li, Wenhan Wu, Ziwei Tang, Lin Shi, John Yang, Jinyang Li, Shunyu Yao, Chen Qian 0006, Binyuan Hui, Qicheng Zhang, Zhiyin Yu, He Du, Ping Yang, Dahua Lin, Chao Peng 0002, Kai Chen 0026. 7511-7531 [doi]

Making Large Language Models into World Models with Precondition and Effect KnowledgeKaige Xie, Ian Yang, John Gunerli, Mark O. Riedl. 7532-7545 [doi]

DORA: Dynamic Optimization Prompt for Continuous Reflection of LLM-based AgentKun Li, Tingzhang Zhao, Wei Zhou, Songlin Hu. 7546-7557 [doi]

Towards Consistent Natural-Language Explanations via Explanation-Consistency FinetuningYanda Chen, Chandan Singh, Xiaodong Liu 0003, Simiao Zuo, Bin Yu 0001, He He 0001, Jianfeng Gao 0001. 7558-7568 [doi]

Propulsion: Steering LLM with Tiny Fine-TuningMd. Kowsher, Nusrat Jahan Prottasha, Prakash Bhat. 7569-7597 [doi]

DEGAP: Dual Event-Guided Adaptive Prefixes for Templated-Based Event Argument Extraction with Slot QueryingGuanghui Wang, Dexi Liu, Jian-Yun Nie, Qizhi Wan, Rong Hu, Xiping Liu, Wanlong Liu, Jiaming Liu. 7598-7613 [doi]

Less is More: A Simple yet Effective Token Reduction Method for Efficient Multi-modal LLMsDingjie Song, Wenjun Wang, Shunian Chen, Xidong Wang, Michael X. Guan, Benyou Wang. 7614-7623 [doi]

Leveraging Large Pre-trained Multilingual Models for High-Quality Speech-to-Text Translation on Industry ScenariosMarko Avila, Josep Crego. 7624-7633 [doi]

SA-DETR: Span Aware Detection Transformer for Moment RetrievalTianheng Xiong, Wei Wei 0002, Kaihe Xu, Dangyang Chen. 7634-7647 [doi]

Aligning LLMs with Individual Preferences via InteractionShujin Wu, Yi R. Fung 0001, Cheng Qian, Jeonghwan Kim, Dilek Hakkani-Tur, Heng Ji. 7648-7662 [doi]

Automatic Evaluation of Language Generation Technology Based on Structure AlignmentKatsuki Chousa, Tsutomu Hirao. 7663-7670 [doi]

Enhancing Talk Moves Analysis in Mathematics Tutoring through Classroom Teaching DiscourseJie Cao, Abhijit Suresh, Jennifer Jacobs 0002, Charis Clevenger, Amanda Howard, Chelsea Brown, Brent Milne, Tom Fischaber, Tamara Sumner, James H. Martin. 7671-7684 [doi]

How to Leverage Digit Embeddings to Represent Numbers?Jasivan Alex Sivakumar, Nafise Sadat Moosavi. 7685-7697 [doi]

AdaCQR: Enhancing Query Reformulation for Conversational Search via Sparse and Dense Retrieval AlignmentYilong Lai, Jialong Wu 0007, Congzhi Zhang, Haowen Sun, Deyu Zhou. 7698-7720 [doi]

EERPD: Leveraging Emotion and Emotion Regulation for Improving Personality DetectionZheng Li, Sujian Li, Dawei Zhu, Qilong Ma, Weimin Xiong. 7721-7734 [doi]

Linear Recency Bias During Training Improves Transformers' Fit to Reading TimesChristian Clark, Byung-Doh Oh, William Schuler. 7735-7747 [doi]

ProsodyFlow: High-fidelity Text-to-Speech through Conditional Flow Matching and Prosody Modeling with Large Speech Language ModelsHaoyu Wang, Sizhe Shan, Yinlin Guo, Yuehai Wang. 7748-7753 [doi]

Mitigating Out-of-Entity Errors in Named Entity Recognition: A Sentence-Level StrategyGuochao Jiang, Ziqin Luo, Chengwei Hu, Zepeng Ding, Deqing Yang. 7754-7765 [doi]

Cross-lingual Evaluation of Multilingual Text GenerationShamil Chollampatt, Minh Quang Pham, Sathish Reddy Indurthi, Marco Turchi. 7766-7777 [doi]

Norm of Mean Contextualized Embeddings Determines their VarianceHiroaki Yamagiwa, Hidetoshi Shimodaira. 7778-7808 [doi]

Exploring the Impacts of Feature Fusion Strategy in Multi-modal Entity AlignmentChenxiao Li, Jingwei Cheng, Qiang Tong, Fu Zhang. 7809-7818 [doi]

Extrapolating to Unknown Opinions Using LLMsKexun Zhang, Jane Dwivedi-Yu, Zhaojiang Lin, Yuning Mao, William Yang Wang, Lei Li 0005, Yi-Chia Wang. 7819-7830 [doi]

How Likely Do LLMs with CoT Mimic Human Reasoning?Guangsheng Bao, Hongbo Zhang, Cunxiang Wang, Linyi Yang, Yue Zhang 0004. 7831-7850 [doi]

SGMEA: Structure-Guided Multimodal Entity AlignmentJingwei Cheng, Mingxiao Guo, Fu Zhang. 7851-7861 [doi]

Unveiling Fake News with Adversarial Arguments Generated by Multimodal Large Language ModelsXiaofan Zheng, Minnan Luo, Xinghao Wang. 7862-7869 [doi]

Incorporating Review-missing Interactions for Generative Explainable RecommendationXi Li, Xiaohe Bo, Chen Ma 0001, Xu Chen 0017. 7870-7880 [doi]

Transformer-based Speech Model Learns Well as Infants and Encodes Abstractions through Exemplars in the Poverty of the Stimulus EnvironmentYi Yang, Yiming Wang, Jiahong Yuan. 7881-7890 [doi]

Hire Me or Not? Examining Language Model's Behavior with Occupation AttributesDamin Zhang, Yi Zhang, Geetanjali Bihani, Julia Rayz. 7891-7911 [doi]

Enhancing Factual Consistency in Text Summarization via Counterfactual DebiasingZhenqing Ling, Yuexiang Xie, Chenhe Dong, Ying Shen 0001. 7912-7924 [doi]

GraCoRe: Benchmarking Graph Comprehension and Complex Reasoning in Large Language ModelsZike Yuan, Ming Liu, Hui Wang, Bing Qin. 7925-7948 [doi]

Exploring Content Predictability in Turn-Taking Through Different Computer-Mediated CommunicationsWanqing He, Calen C. MacDonald, Yejoon Yoo, Marcos Eizayaga, Ryun Shim, Lev D. Katreczko, Susan R. Fussell. 7949-7962 [doi]

VEEF-Multi-LLM: Effective Vocabulary Expansion and Parameter Efficient Finetuning Towards Multilingual Large Language ModelsJiu Sha, Mengxiao Zhu, Chong Feng, Yuming Shang. 7963-7981 [doi]

PERC: Plan-As-Query Example Retrieval for Underrepresented Code GenerationJaeseok Yoo, Hojae Han, Youngwon Lee 0003, Jaejin Kim, Seung-won Hwang. 7982-7997 [doi]

Multilingual and Explainable Text Detoxification with Parallel CorporaDaryna Dementieva, Nikolay Babakov, Amit Ronen, Abinew Ali Ayele, Naquee Rizwan, Florian Schneider 0001, Xintong Wang 0001, Seid Muhie Yimam, Daniil Alekhseevich Moskovskiy, Elisei Stakovskii, Eran Kaufman, Ashraf Elnagar, Animesh Mukherjee 0001, Alexander Panchenko. 7998-8025 [doi]

Semantic Captioning: Benchmark Dataset and Graph-Aware Few-Shot In-Context Learning for SQL2TextAli Al-Lawati, Jason Lucas, Prasenjit Mitra. 8026-8042 [doi]

Factual Knowledge Assessment of Language Models Using DistractorsHichem Ammar Khodja, Abderrahmane Ait gueni ssaid, Frédéric Béchet, Quentin Brabant, Alexis Nasr, Gwénolé Lecorvé. 8043-8056 [doi]

Paraphrase Generation Evaluation Powered by an LLM: A Semantic Metric, Not a Lexical OneQuentin Lemesle, Jonathan Chevelu, Philippe Martin, Damien Lolive, Arnaud Delhay, Nelly Barbot. 8057-8087 [doi]

Summarization of Opinionated Political Documents with Varied PerspectivesNicholas Deas, Kathleen R. McKeown. 8088-8108 [doi]

Measuring Contextual Informativeness in Child-Directed TextMaria R. Valentini, Téa Y. Wright, Ali Marashian, Jennifer M. Ellis, Eliana Colunga, Katharina von der Wense. 8109-8120 [doi]

Can Large Language Models Differentiate Harmful from Argumentative Essays? Steps Toward Ethical Essay ScoringHongjin Kim, Jeonghyun Kang, Harksoo Kim. 8121-8147 [doi]

Zero-Shot Entailment Learning for Ontology-Based Biomedical Annotation Without Explicit MentionsRumana Ferdous Munne, Noriki Nishida, Shanshan Liu, Narumi Tokunaga, Yuki Yamagata, Kouji Kozaki, Yuji Matsumoto 0001. 8148-8159 [doi]

Mitigating Shortcut Learning via Smart Data Augmentation based on Large Language ModelXinyi Sun, Hongye Tan, Yaxin Guo, Pengpeng Qiang, Ru Li 0001, Hu Zhang 0003. 8160-8172 [doi]

DeTriever: Decoder-representation-based Retriever for Improving NL2SQL In-Context LearningRaymond Li, Yuxi Feng, Zhenan Fan, Giuseppe Carenini, Weiwei Zhang, Mohammadreza Pourreza, Yong Zhang. 8173-8183 [doi]

Improving NMT Models by Retrofitting Quality Estimators into Trainable Energy LossGahyun Yoo, Jay Yoon Lee. 8184-8196 [doi]

What Makes for Good Visual Instructions? Synthesizing Complex Visual Reasoning Instructions for Visual Instruction TuningYifan Du 0002, Hangyu Guo, Kun Zhou 0002, Wayne Xin Zhao, Jinpeng Wang 0001, Chuyuan Wang, Mingchen Cai, Ruihua Song, Ji-Rong Wen. 8197-8214 [doi]

TriFine: A Large-Scale Dataset of Vision-Audio-Subtitle for Tri-Modal Machine Translation and Benchmark with Fine-Grained Annotated TagsBoyu Guan, Yining Zhang, Yang Zhao 0007, Chengqing Zong. 8215-8231 [doi]

Can Many-Shot In-Context Learning Help LLMs as Evaluators? A Preliminary Empirical StudyMingYang Song, Mao Zheng, Xuan Luo. 8232-8241 [doi]

GEAR: A Simple GENERATE, EMBED, AVERAGE AND RANK Approach for Unsupervised Reverse DictionaryFatemah Yousef Almeman, Luis Espinosa Anke. 8242-8254 [doi]

Momentum Posterior Regularization for Multi-hop Dense RetrievalZehua Xia, Yuyang Wu, Yiyun Xia, Cam-Tu Nguyen. 8255-8271 [doi]

CaDRL: Document-level Relation Extraction via Context-aware Differentiable Rule LearningKunli Zhang, Pengcheng Wu, Bohan Yu, Kejun Wu, Aoze Zheng, Xiyang Huang, Chenkang Zhu, Min Peng, Hongying Zan, Yu Song. 8272-8284 [doi]

TEF: Causality-Aware Taxonomy Expansion via Front-Door CriterionYuan Meng, Songlin Zhai, Yuxin Zhang, Zhongjian Hu, Guilin Qi. 8285-8294 [doi]

Inside-Outside Algorithm for Probabilistic Product-Free Lambek Categorial GrammarJinman Zhao, Gerald Penn. 8295-8303 [doi]

Perceive the Passage of Time: A Systematic Evaluation of Large Language Model in Temporal RelativityShuang Chen, Yining Zheng, Shimin Li, Qinyuan Cheng, Xipeng Qiu. 8304-8313 [doi]

Hit the Sweet Spot! Span-Level Ensemble for Large Language ModelsYangyifan Xu, Jianghao Chen, Junhong Wu, Jiajun Zhang. 8314-8325 [doi]

PToco: Prefix-based Token-level Collaboration Enhances Reasoning for Multi-LLMsYuang Bian, Yupian Lin, JingPing Liu, Tong Ruan. 8326-8335 [doi]

MAGRET: Machine-generated Text Detection with Rewritten TextsYifei Huang, Jiuxin Cao, Hanyu Luo, Xin Guan, Bo Liu. 8336-8346 [doi]

Structured List-Grounded Question AnsweringMujeen Sung, Song Feng 0001, James Gung, Raphael Shu, Yi Zhang 0053, Saab Mansour. 8347-8359 [doi]

Low-Resource Language Expansion and Translation Capacity Enhancement for LLM: A Study on the UyghurKaiwen Lu, Yating Yang, Fengyi Yang, Rui Dong 0002, Bo Ma 0004, Aihetamujiang Aihemaiti, Abibulla Atawulla, Lei Wang 0065, Xi Zhou. 8360-8373 [doi]

Unraveling the Mystery: Defending Against Jailbreak Attacks Via Unearthing Real IntentionYanhao Li, Hongshen Chen, Heng Zhang, Zhiwei Ge, Tianhao Li, Sulong Xu, Guibo Luo. 8374-8384 [doi]

A Flash in the Pan: Better Prompting Strategies to Deploy Out-of-the-Box LLMs as Conversational Recommendation SystemsGustavo Adolpho Lucas de Carvalho, Simon Ben Igeri, Jennifer Healey, Victor S. Bursztyn, David Demeter, Lawrence Birnbaum. 8385-8398 [doi]

Rule-KBQA: Rule-Guided Reasoning for Complex Knowledge Base Question Answering with Large Language ModelsZhiqiang Zhang, Liqiang Wen, Wen Zhao. 8399-8417 [doi]

Mitigating Language Confusion through Inference-time InterventionYunfan Xie, Lixin Zou, Dan Luo 0004, Min Tang, Chenliang Li, Liming Dong 0003, Xiangyang Luo. 8418-8431 [doi]

Detecting deepfakes and false ads through analysis of text and social engineering techniquesAlicja Martinek, Ewelina Bartuzi-Trokielewicz. 8432-8448 [doi]

Indigenous Languages Spoken in Argentina: A Survey of NLP and Speech ResourcesBelu Ticona, Fernando Martín Carranza, Viviana Cotik. 8449-8461 [doi]

The Role of Natural Language Processing Tasks in Automatic Literary Character Network ConstructionArthur Amalvy, Vincent Labatut, Richard Dufour. 8462-8473 [doi]

Cultural Alignment in Large Language Models: An Explanatory Analysis Based on Hofstede's Cultural DimensionsReem I. Masoud, Ziquan Liu, Martin Ferianc, Philip C. Treleaven, Miguel Rodrigues. 8474-8503 [doi]

META-LORA: Memory-Efficient Sample Reweighting for Fine-Tuning Large Language ModelsWeicheng Li, Lixin Zou, Min Tang, Qing Yu, Wanli Li 0002, Chenliang Li. 8504-8517 [doi]

Can Large Language Models perform Relation-based Argument Mining?Deniz Gorur, Antonio Rago 0001, Francesca Toni. 8518-8534 [doi]

Contextual Augmentation for Entity Linking using Large Language ModelsDaniel Vollmers, Hamada M. Zahera, Diego Moussallem, Axel-Cyrille Ngonga Ngomo. 8535-8545 [doi]

CmEAA: Cross-modal Enhancement and Alignment Adapter for Radiology Report GenerationXiyang Huang, Yingjie Han, Yx L, Runzhi Li, Pengcheng Wu, Kunli Zhang. 8546-8556 [doi]

Semantic Reshuffling with LLM and Heterogeneous Graph Auto-Encoder for Enhanced Rumor DetectionGuoyi Li, Die Hu, Zongzhen Liu, Xiaodan Zhang 0004, Honglei Lyu. 8557-8572 [doi]

Extracting, Detecting, and Generating Research Questions for Scientific ArticlesSina Taslimi, Artemis Çapari, Hosein Azarbonyad, Zi Long Zhu, Zubair Afzal, Evangelos Kanoulas, George Tsatsaronis 0001. 8573-8588 [doi]

Confront Insider Threat: Precise Anomaly Detection in Behavior Logs Based on LLM Fine-TuningShuang Song, Yifei Zhang, Neng Gao. 8589-8601 [doi]

Flashback: Memory Mechanism for Enhancing Memory Efficiency and Speed in Deep Sequential ModelsTaiki Sekii. 8602-8611 [doi]

Engagement-driven Persona Prompting for Rewriting News TweetsReshmi Gopalakrishna Pillai, Antske Fokkens, Wouter van Atteveldt. 8612-8622 [doi]

A Chain-of-Task Framework for Instruction Tuning of LLMs Based on Chinese Grammatical Error CorrectionXinpeng Liu, Bing Xu, Muyun Yang, Hailong Cao, Conghui Zhu, Tiejun Zhao, Wenpeng Lu. 8623-8639 [doi]

Beyond Dataset Creation: Critical View of Annotation Variation and Bias Probing of a Dataset for Online Radical Content DetectionArij Riabi, Virginie Mouilleron, Menel Mahamdi, Wissam Antoun, Djamé Seddah. 8640-8663 [doi]

AraTrust: An Evaluation of Trustworthiness for LLMs in ArabicEmad A. Alghamdi, Reem I. Masoud, Deema Alnuhait, Afnan Y. Alomairi, Ahmed Ashraf, Mohamed Zaytoon. 8664-8679 [doi]

Comparative Study of Multilingual Idioms and Similes in Large Language ModelsParia Khoshtab, Danial Namazifard, Mostafa Masoudi, Ali Akhgary, Samin Mahdizadeh Sani, Yadollah Yaghoobzadeh. 8680-8698 [doi]

FedCSR: A Federated Framework for Multi-Platform Cross-Domain Sequential Recommendation with Dual Contrastive LearningDongyi Zheng, Hongyu Zhang 0002, Jianyang Zhai, Lin Zhong, Lingzhi Wang, Jiyuan Feng, Xiangke Liao, Yonghong Tian 0001, Nong Xiao, Qing Liao 0001. 8699-8713 [doi]

Multi-Modal Entities Matter: Benchmarking Multi-Modal Entity AlignmentGuanchen Xiao, Weixin Zeng, ShiQi Zhang, Mingrui Lao, Xiang Zhao. 8714-8724 [doi]

Enhancing Extractive Question Answering in Multiparty Dialogues with Logical Inference Memory NetworkShu Zhou, Rui Zhao, Zhengda Zhou, Haohan Yi, Xuhui Zheng, Hao Wang. 8725-8738 [doi]

Enhancing Discourse Parsing for Local Structures from Social Media with LLM-Generated DataMartial Pastor, Nelleke Oostdijk, Patricia Martín-Rodilla, Javier Parapar. 8739-8748 [doi]

PARAPHRASUS: A Comprehensive Benchmark for Evaluating Paraphrase Detection ModelsAndrianos Michail, Simon Clematide, Juri Opitz. 8749-8762 [doi]

Dynamic-prototype Contrastive Fine-tuning for Continual Few-shot Relation Extraction with Unseen Relation DetectionSi Miao Zhao, Zhen Tan, Ning Pang, Weidong Xiao, Xiang Zhao 0002. 8763-8773 [doi]

Enhancing Rhetorical Figure Annotation: An Ontology-Based Web Application with RAG IntegrationRamona Kühn, Jelena Mitrovic, Michael Granitzer. 8774-8786 [doi]

Quantifying the Influence of Evaluation Aspects on Long-Form Response AssessmentGo Kamoda, Akari Asai, Ana Brassard, Keisuke Sakaguchi. 8787-8808 [doi]

CharMoral: A Character Morality Dataset for Morally Dynamic Character Analysis in Long-Form NarrativesSuyoung Bae, Gunhee Cho, Yun-Gyung Cheong, Boyang Li. 8809-8818 [doi]

Incremental Transformer: Efficient Encoder for Incremented Text Over MRC and Conversation TasksWeisheng Li, Yuechen Wang, Jiaxin Shi, Wengang Zhou, Qi Tian 0001, Houqiang Li. 8819-8829 [doi]

Enhancing Large Language Models for Document-Level Translation Post-Editing Using Monolingual DataZongyao Li, Zhiqiang Rao, Hengchao Shang, Jiaxin Guo, Shaojun Li, Daimeng Wei, Hao Yang. 8830-8840 [doi]

PMSS: Pretrained Matrices Skeleton Selection for LLM Fine-tuningQibin Wang, Xiaolin Hu, Weikai Xu, Wei Liu 0005, Jian Luan 0001, Bin Wang 0004. 8841-8857 [doi]

Learn from Failure: Causality-guided Contrastive Learning for Generalizable Implicit Hate Speech DetectionTianming Jiang. 8858-8867 [doi]

Extending LLMs to New Languages: A Case Study of Llama and Persian AdaptationSamin Mahdizadeh Sani, Pouya Sadeghi, Thuy-Trang Vu, Yadollah Yaghoobzadeh, Gholamreza Haffari. 8868-8884 [doi]

Inductive Link Prediction in N-ary Knowledge GraphsJiyao Wei, Saiping Guan, Xiaolong Jin, Jiafeng Guo, Xueqi Cheng. 8885-8896 [doi]

ZigZagKV: Dynamic KV Cache Compression for Long-context Modeling based on Layer UncertaintyMeizhi Zhong, Xikai Liu, Chen Zhang 0020, Yikun Lei, Yan Gao, Yao Hu, Kehai Chen, Min Zhang 0005. 8897-8907 [doi]

Automatic Mathematic In-Context Example Generation for LLM Using Multi-Modal ConsistencyJaeseong Lee, Wei Yang 0013, Gopal Gupta, Shiyi Wei. 8908-8924 [doi]

From Traits to Empathy: Personality-Aware Multimodal Empathetic Response GenerationJiaqiang Wu, Xuandong Huang, Zhouan Zhu, Shangfei Wang. 8925-8938 [doi]

Integrating Visual Modalities with Large Language Models for Mental Health SupportZhouan Zhu, Shangfei Wang, Yuxin Wang, Jiaqiang Wu. 8939-8954 [doi]

Understanding the RoPE Extensions of Long-Context LLMs: An Attention PerspectiveMeizhi Zhong, Chen Zhang 0020, Yikun Lei, Xikai Liu, Yan Gao, Yao Hu, Kehai Chen, Min Zhang 0005. 8955-8962 [doi]

Selected Languages are All You Need for Cross-lingual Truthfulness TransferWeihao Liu, Ning Wu, Wenbiao Ding, Shining Liang, Ming Gong 0001, Dongmei Zhang 0001. 8963-8978 [doi]

OVEL: Online Video Entity LinkingHaiquan Zhao, Xuwu Wang, Shisong Chen, Zhixu Li, Xin Zheng, Yanghua Xiao. 8979-8991 [doi]

The Only Way is Ethics: A Guide to Ethical Research with Large Language ModelsEddie L. Ungless, Nikolas Vitsakis, Zeerak Talat, James Garforth, Björn Ross, Arno Onken, Atoosa Kasirzadeh, Alexandra Birch. 8992-9005 [doi]

Should We Use a Fixed Embedding Size? Customized Dimension Sizes for Knowledge Graph EmbeddingZhanpeng Guan, Zhao Zhang 0011, Yiqing Wu, Fuwei Zhang, Yongjun Xu. 9006-9012 [doi]

Chinese Automatic Readability Assessment Using Adaptive Pre-training and Linguistic Feature FusionXusheng Yang, JinCai Yang, Xiao Li. 9013-9024 [doi]

Multitask-Bench: Unveiling and Mitigating Safety Gaps in LLMs Fine-tuningEssa Jan, Nouar AlDahoul, Moiz Ali, Faizan Ahmad, Fareed Zaffar, Yasir Zaki. 9025-9043 [doi]

Unmasking the Imposters: How Censorship and Domain Adaptation Affect the Detection of Machine-Generated TweetsBryan E. Tuck, Rakesh M. Verma. 9044-9061 [doi]

Detecting Emotional Incongruity of Sarcasm by Commonsense ReasoningZiqi Qiu, Jianxing Yu, Yufeng Zhang, Hanjiang Lai, Yanghui Rao, Qinliang Su, Jian Yin 0001. 9062-9073 [doi]

Enhancing the Reasoning Capabilities of Small Language Models via Solution Guidance Fine-TuningJing Bi, Yuting Wu, Weiwei Xing, Zhenjie Wei. 9074-9084 [doi]

LOG: A Local-to-Global Optimization Approach for Retrieval-based Explainable Multi-Hop Question AnsweringHao Xu, Yunxiao Zhao, Jiayang Zhang, Zhiqiang Wang 0005, Ru Li 0001. 9085-9095 [doi]

KG-TRICK: Unifying Textual and Relational Information Completion of Knowledge for Multilingual Knowledge GraphsZelin Zhou, Simone Conia, Daniel Lee, Min Li, Shenglei Huang, Umar Farooq Minhas, Saloni Potdar, Henry Xiao, Yunyao Li 0001. 9096-9111 [doi]

Impromptu Cybercrime Euphemism DetectionXiang Li, Yucheng Zhou, Laiping Zhao, Jing Li, Fangming Liu. 9112-9123 [doi]

ALIS: Aligned LLM Instruction Security Strategy for Unsafe Input PromptXinhao Song, Sufeng Duan, Gongshen Liu. 9124-9146 [doi]

ProTOD: Proactive Task-oriented Dialogue System Based on Large Language ModelWenjie Dong, Sirong Chen, Yan Yang. 9147-9164 [doi]

Towards Multilingual spoken Visual Question Answering system using Cross-AttentionAmartya Roy Chowdhury, Tonmoy Rajkhowa, Sanjeev Sharma. 9165-9175 [doi]

Detecting Conversational Mental Manipulation with Intent-Aware PromptingJiayuan Ma, Hongbin Na, Zimu Wang, Yining Hua, Yue Liu, Wei Wang 0042, Ling Chen 0006. 9176-9183 [doi]

MIGRATE: Cross-Lingual Adaptation of Domain-Specific LLMs through Code-Switching and Embedding TransferSeongtae Hong, Seungyoon Lee, Hyeonseok Moon, HeuiSeok Lim. 9184-9193 [doi]

CoSTA: Code-Switched Speech Translation using Aligned Speech-Text InterleavingBhavani Shankar, Preethi Jyothi, Pushpak Bhattacharyya. 9194-9208 [doi]

Bridging the Language Gap: Dynamic Learning Strategies for Improving Multilingual Performance in LLMsSomnath Kumar, Vaibhav Balloli, Mercy Ranjit, Kabir Ahuja, Sunayana Sitaram, Kalika Bali, Tanuja Ganu, Akshay Nambi 0001. 9209-9223 [doi]

Poetry in Pixels: Prompt Tuning for Poem Image Generation via Diffusion ModelsSofia Jamil, Bollampalli Areen Reddy, Raghvendra Kumar 0003, Sriparna Saha 0001, K. J. Joseph, Koustava Goswami. 9224-9237 [doi]

Argumentation and Domain Discourse in Scholarly Articles on the Theory of International RelationsMagdalena Wolska, Sassan Gholiagha, Mitja Sienknecht, Dora Kiesel, Irene López García, Patrick Riehmann, Matti Wiegmann, Bernd Froehlich 0001, Katrin Girgensohn, Jürgen Neyer, Benno Stein 0001. 9238-9249 [doi]

Semantic and Sentiment Dual-Enhanced Generative Model for Script Event PredictionFeiyang Wu, Peixin Huang, Yanli Hu, Zhen Tan, Xiang Zhao 0002. 9250-9259 [doi]

Generation-Based and Emotion-Reflected Memory Update: Creating the KEEM Dataset for Better Long-Term ConversationJeonghyun Kang, Hongjin Kim, Harksoo Kim. 9260-9277 [doi]

medIKAL: Integrating Knowledge Graphs as Assistants of LLMs for Enhanced Clinical Diagnosis on EMRsMingyi Jia, Junwen Duan, Yan Song, Jianxin Wang. 9278-9298 [doi]

AIDER: a Robust and Topic-Independent Framework for Detecting AI-Generated TextJiayi Gui, Baitong Cui, Xiaolian Guo, Ke Yu, Xiaofei Wu. 9299-9310 [doi]

CFSP: An Efficient Structured Pruning Framework for LLMs with Coarse-to-Fine Activation InformationYuxin Wang 0002, Minghua Ma, Zekun Wang, Jingchang Chen, Liping Shan, Qing Yang 0033, Dongliang Xu, Ming Liu 0004, Bing Qin 0001. 9311-9328 [doi]

Do LLMs Know When to NOT Answer? Investigating Abstention Abilities of Large Language ModelsNishanth Madhusudhan, Sathwik Tejaswi Madhusudhan, Vikas Yadav, Masoud Hashemi. 9329-9345 [doi]

Dr.ECI: Infusing Large Language Models with Causal Knowledge for Decomposed Reasoning in Event Causality IdentificationRuichu Cai, Shengyin Yu, Jiahao Zhang, Wei Chen, Boyan Xu, Keli Zhang. 9346-9375 [doi]

InternLM-Law: An Open-Sourced Chinese Legal Large Language ModelZhiwei Fei, Songyang Zhang, Xiaoyu Shen 0001, Dawei Zhu, Xiao Wang 0042, JiDong Ge, Vincent Ng 0001. 9376-9392 [doi]

Let's Focus on Neuron: Neuron-Level Supervised Fine-tuning for Large Language ModelHaoyun Xu, Runzhe Zhan, Yingpeng Ma, Derek F. Wong, Lidia S. Chao. 9393-9406 [doi]

Cross-Domain Fake News Detection based on Dual-Granularity Adversarial TrainingWenjie Wei, Yanyue Zhang, Jinyan Li, Panfei Liu, Deyu Zhou. 9407-9417 [doi]

Position Information Emerges in Causal Transformers Without Positional Encodings via Similarity of Nearby EmbeddingsChunsheng Zuo, Pavel Guerzhoy, Michael Guerzhoy. 9418-9430 [doi]

RISCORE: Enhancing In-Context Riddle Solving in Language Models through Context-Reconstructed Example AugmentationIoannis Panagiotopoulos, George Filandrianos, Maria Lymperaiou, Giorgos Stamou. 9431-9455 [doi]

Ranking Over Scoring: Towards Reliable and Robust Automated Evaluation of LLM-Generated Medical Explanatory ArgumentsIker de la Iglesia, Iakes Goenaga, Johanna Ramirez-Romero, Jose Maria Villa-Gonzalez, Josu Goikoetxea, Ander Barrena. 9456-9471 [doi]

CACA: Context-Aware Cross-Attention Network for Extractive Aspect Sentiment Quad PredictionBingfeng Chen, Haoran Xu, Yongqi Luo, Boyan Xu, Ruichu Cai, Zhifeng Hao. 9472-9484 [doi]

Improved Sparse Upcycling for Instruction TuningWangyi Jiang, Yaojie Lu 0001, Hongyu Lin, Xianpei Han, Le Sun 0001. 9485-9498 [doi]

SLAM: Towards Efficient Multilingual Reasoning via Selective Language AlignmentYuchun Fan, Yongyu Mu, Yilin Wang, Lei Huang, Junhao Ruan, Bei Li, Tong Xiao, Shujian Huang, Xiaocheng Feng, Jingbo Zhu. 9499-9515 [doi]

ME2-BERT: Are Events and Emotions what you need for Moral Foundation Prediction?Lorenzo Zangari, Candida Maria Greco, Davide Picca, Andrea Tagarelli. 9516-9532 [doi]

SCCD: A Session-based Dataset for Chinese Cyberbullying DetectionQingpo Yang, Yakai Chen, Zihui Xu, Yuming Shang, Sanchuan Guo, Xi Zhang 0008. 9533-9545 [doi]

Hands-off Image Editing: Language-guided Editing without any Task-specific Labeling, Masking or even TrainingRodrigo Santos, António Branco, João Ricardo Silva, João Rodrigues 0001. 9546-9565 [doi]

Beyond Film Subtitles: Is YouTube the Best Approximation of Spoken Vocabulary?Adam Nohejl, Frederikus Hudi, Eunike Andriani Kardinata, Shintaro Ozaki, Maria Angelica Riera Machin, Hongyu Sun, Justin Vasselli, Taro Watanabe. 9566-9585 [doi]

RealSafe: Quantifying Safety Risks of Language Agents in Real-WorldYingning Ma. 9586-9617 [doi]

Voice synthesis in Polish and English - analyzing prediction differences in speaker verification systemsJoanna Gajewska, Alicja Martinek, Michal J. Olowski, Ewelina Bartuzi-Trokielewicz. 9618-9629 [doi]

AgriCLIP: Adapting CLIP for Agriculture and Livestock via Domain-Specialized Cross-Model AlignmentUmair Nawaz, Muhammad Awais, Hanan Gani, Muzammal Naseer, Fahad Shahbaz Khan, Salman H. Khan 0001, Rao Muhammad Anwer. 9630-9639 [doi]

RUIE: Retrieval-based Unified Information Extraction using Large Language ModelXincheng Liao, Junwen Duan, Yixi Huang, Jianxin Wang 0001. 9640-9655 [doi]

It is not a piece of cake for GPT: Explaining Textual Entailment Recognition in the presence of Figurative LanguageGiuseppe Gallipoli, Luca Cagliero. 9656-9674 [doi]

MuKA: Multimodal Knowledge Augmented Visual Information-SeekingLianghao Deng, Yuchong Sun, Shizhe Chen, Ning Yang, Yunfeng Wang, Ruihua Song. 9675-9686 [doi]

MSG-LLM: A Multi-scale Interactive Framework for Graph-enhanced Large Language ModelsJiayu Ding, Zhangkai Zheng, Benshuo Lin, Yun Xue, Yiping Song. 9687-9700 [doi]

MedEx: Enhancing Medical Question-Answering with First-Order Logic based Reasoning and Knowledge InjectionAizan Zafar, Kshitij Mishra, Asif Ekbal. 9701-9720 [doi]

Zero-shot and Few-shot Learning with Instruction-following LLMs for Claim Matching in Automated Fact-checkingDina Pisarevskaya, Arkaitz Zubiaga. 9721-9736 [doi]

Reasoning Graph Enhanced Exemplars Retrieval for In-Context LearningYukang Lin, Bingchen Zhong, Shuoran Jiang, Joanna Siebert, Qingcai Chen. 9737-9759 [doi]

A Review of Prominent Paradigms for LLM-Based Agents: Tool Use, Planning (Including RAG), and Feedback LearningXinzhe Li. 9760-9779 [doi]

Analyzing Offensive Language Dataset Insights from Training Dynamics and Human Agreement LevelDo-Kyung Kim, Hyeseon Ahn, Youngwook Kim, Yo-Sub Han. 9780-9792 [doi]

Solid-SQL: Enhanced Schema-linking based In-context Learning for Robust Text-to-SQLGeling Liu, Yunzhi Tan, Ruichao Zhong, Yuanzhen Xie, Lingchen Zhao, Qian Wang 0002, Bo Hu, Zang Li. 9793-9803 [doi]

Mitigating the Discrepancy Between Video and Text Temporal Sequences: A Time-Perception Enhanced Video Grounding method for LLMXuefen Li, Bo Wang, Ge Shi 0002, Chong Feng 0001, Jiahao Teng. 9804-9813 [doi]

CE-DA: Custom Embedding and Dynamic Aggregation for Zero-Shot Relation ExtractionFu Zhang, He Liu, Zehan Li, Jingwei Cheng. 9814-9823 [doi]

NesTools: A Dataset for Evaluating Nested Tool Learning Abilities of Large Language ModelsHan Han, Tong Zhu, Xiang Zhang, Mengsong Wu, Hao Xiong, Wenliang Chen. 9824-9844 [doi]

A Benchmark and Robustness Study of In-Context-Learning with Large Language Models in Music Entity DetectionSimon Hachmeier, Robert Jäschke. 9845-9859 [doi]

Do Current Video LLMs Have Strong OCR Abilities? A Preliminary StudyYulin Fei, YuHui Gao, Xingyuan Xian, Xiaojin Zhang 0002, Tao Wu, Wei Chen 0088. 9860-9876 [doi]

Disentangle to Decay: Linear Attention with Trainable Decay FactorHaibo Tong, Chenyang Zhang, Jiayi Lin, Bingxuan Hou, Qingqing Hong, Junli Wang. 9877-9890 [doi]

GAProtoNet: A Multi-head Graph Attention-based Prototypical Network for Interpretable Text ClassificationXiming Wen, Wenjuan Tan, Rosina Weber. 9891-9901 [doi]

Few-shot domain adaptation for named-entity recognition via joint constrained k-means and subspace selectionAyoub Hammal, Benno Uthayasooriyar, Caio Corro. 9902-9916 [doi]

An Efficient Retrieval-Based Method for Tabular Prediction with LLMJie Wu, Mengshu Hou. 9917-9925 [doi]

AIGT: AI Generative Table Based on PromptMingming Zhang, Zhiqing Xiao, Guoshan Lu, Sai Wu, Weiqiang Wang, Xing Fu, Can Yi, Junbo Zhao 0002. 9926-9938 [doi]

IRR: Image Review Ranking Framework for Evaluating Vision-Language ModelsKazuki Hayashi, Kazuma Onishi, Toma Suzuki, Yusuke Ide, Seiji Gobara, Shigeki Saito, Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi, Taro Watanabe. 9939-9956 [doi]

Development of Numerical Error Detection Tasks to Analyze the Numerical Capabilities of Language ModelsTaku Sakamoto, Saku Sugawara, Akiko Aizawa. 9957-9976 [doi]

Searching for Structure: Investigating Emergent Communication with Large Language ModelsTom Kouwenhoven, Max Peeperkorn, Tessa Verhoef. 9977-9991 [doi]

Decoding Decoded: Understanding Hyperparameter Effects in Open-Ended Text GenerationEsteban Garces Arias, Meimingwei Li, Christian Heumann, Matthias Aßenmacher. 9992-10020 [doi]

Does RAG Introduce Unfairness in LLMs? Evaluating Fairness in Retrieval-Augmented Generation SystemsXuyang Wu 0002, Shuowei Li, Hsin-Tai Wu, Zhiqiang Tao, Yi Fang 0008. 10021-10036 [doi]

CUTE: A Multilingual Dataset for Enhancing Cross-Lingual Knowledge Transfer in Low-Resource LanguagesWenhao Zhuang, Yuan Sun. 10037-10046 [doi]

How Ambiguous Are the Rationales for Natural Language Reasoning? A Simple Approach to Handling Rationale UncertaintyHazel H. Kim. 10047-10053 [doi]

Planning with Multi-Constraints via Collaborative Language AgentsCong Zhang, Derrick-Goh-Xin Deik, Dexun Li, Hao Zhang, Yong Liu. 10054-10082 [doi]

Enhancing Nursing and Elderly Care with Large Language Models: An AI-Driven FrameworkQiao Sun, Jiexin Xie, Nanyang Ye 0001, Qinying Gu, Shijie Guo. 10083-10090 [doi]

A High-Quality Text-Rich Image Instruction Tuning Dataset via Hybrid Instruction GenerationShijie Zhou, Ruiyi Zhang, Yufan Zhou, Changyou Chen. 10091-10110 [doi]

Cross-Lingual Knowledge Projection and Knowledge Enhancement for Zero-Shot Question Answering in Low-Resource LanguagesSello Ralethe, Jan Buys. 10111-10124 [doi]

FarExStance: Explainable Stance Detection for FarsiMajid Zarharan, Maryam Hashemi, Malika Behroozrazegh, Sauleh Eetemadi, Mohammad Taher Pilehvar, Jennifer Foster. 10125-10147 [doi]

Unveiling Language Competence Neurons: A Psycholinguistic Approach to Model InterpretabilityXufeng Duan, Xinyu Zhou, Bei Xiao, Zhenguang G. Cai. 10148-10157 [doi]

Cross-Dialect Information Retrieval: Information Access in Low-Resource and High-Variance LanguagesRobert Litschko, Oliver Kraus, Verena Blaschke, Barbara Plank. 10158-10171 [doi]

MoKA: Parameter Efficiency Fine-Tuning via Mixture of Kronecker Product AdaptionBeiming Yu, Zhenfei Yang, XiusHuang Yi. 10172-10182 [doi]

AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction SimulatorZhihao Fan, Lai Wei, Jialong Tang, Wei Chen 0088, Siyuan Wang, Zhongyu Wei, Fei Huang 0004. 10183-10213 [doi]

Can LLMs Help Create Grammar?: Automating Grammar Creation for Endangered Languages with In-Context LearningPiyapath T. Spencer, Nanthipat Kongborrirak. 10214-10227 [doi]

Decompose-ToM: Enhancing Theory of Mind Reasoning in Large Language Models through Simulation and Task DecompositionSneheel Sarangi, Maha Elgarf, Hanan Salam. 10228-10241 [doi]

Bridging Context Gaps: Enhancing Comprehension in Long-Form Social Conversations Through Contextualized ExcerptsShrestha Mohanty, Sarah Xuan, Jacob Jobraeel, Anurag Kumar, Deb Roy, Jad Kabbara. 10242-10274 [doi]

Who Wrote This? The Key to Zero-Shot LLM-Generated Text Detection Is GECScoreJunchao Wu, Runzhe Zhan, Derek F. Wong, Shu Yang, Xuebo Liu 0002, Lidia S. Chao, Min Zhang 0005. 10275-10292 [doi]

VoxpopuliTTS: a large-scale multilingual TTS corpus for zero-shot speech generationWenrui Liu 0003, Jionghao Bai, Xize Cheng, Jialong Zuo, Ziyue Jiang 0001, Shengpeng Ji, Minghui Fang 0002, Xiaoda Yang, Qian Yang, Zhou Zhao. 10293-10297 [doi]

Self-Evolution Knowledge Distillation for LLM-based Machine TranslationYuncheng Song, Liang Ding 0006, Changtong Zan, Shujian Huang. 10298-10308 [doi]

On Weaponization-Resistant Large Language Models with Prospect Theoretic AlignmentZehua Cheng, Manying Zhang, Jiahao Sun, Wei Dai. 10309-10324 [doi]

Exploring the Reliability of Large Language Models as Customized Evaluators for Diverse NLP TasksQintong Li, Leyang Cui, Lingpeng Kong, Wei Bi. 10325-10344 [doi]

Dynamics of Instruction Fine-Tuning for Chinese Large Language ModelsChiyu Song, Zhanchao Zhou, Jianhao Yan, Yuejiao Fei, Zhenzhong Lan, Yue Zhang 0004. 10345-10366 [doi]

Evaluating Transformers for OCR Post-Correction in Early Modern Dutch TheatreFlorian Debaene, Aaron Maladry, Els Lefever, Véronique Hoste. 10367-10374 [doi]

BANER: Boundary-Aware LLMs for Few-Shot Named Entity RecognitionQuanjiang Guo, Yihong Dong, Ling Tian, Zhao Kang 0001, Yu Zhang 0092, Sijie Wang. 10375-10389 [doi]

In-Context Reinforcement Learning with Retrieval-Augmented Generation for Text-to-SQLRishit Toteja, Arindam Sarkar, Prakash Mandayam Comar. 10390-10397 [doi]

ICLEval: Evaluating In-Context Learning Ability of Large Language ModelsWentong Chen, Yankai Lin, Zhenhao Zhou, Hongyun Huang, Yantao Jia, Zhao Cao, Ji-Rong Wen. 10398-10422 [doi]

VisualRWKV: Exploring Recurrent Neural Networks for Visual Language ModelsHaowen Hou, Peigen Zeng, Fei Ma 0006, Fei Richard Yu. 10423-10434 [doi]

Let LLMs Take on the Latest Challenges! A Chinese Dynamic Question Answering BenchmarkZhikun Xu, Yinghui Li, Ruixue Ding, Xinyu Wang 0013, Boli Chen, Yong Jiang, Haitao Zheng, Wenlian Lu, Pengjun Xie, Fei Huang. 10435-10448 [doi]

Making Task-Oriented Dialogue Datasets More Natural by Synthetically Generating Indirect User RequestsAmogh Mannekote, Jinseok Nam, Ziming Li, Kristy Elizabeth Boyer, Bonnie J. Dorr. 10449-10459 [doi]

Consistency Rating of Semantic Transparency: an Evaluation Method for Metaphor Competence in Idiom Understanding TasksHui Gao, Jing Zhang, Peng Zhang, Chang Yang. 10460-10471 [doi]

KG-FPQ: Evaluating Factuality Hallucination in LLMs with Knowledge Graph-based False Premise QuestionsYanXu Zhu, Jinlin Xiao, Yuhang Wang, Jitao Sang. 10472-10490 [doi]

IberoBench: A Benchmark for LLM Evaluation in Iberian LanguagesIrene Baucells, Javier Aula-Blasco, Iria de-Dios-Flores, Silvia Paniagua Suárez, Naiara Pérez, Anna Salles, Susana Sotelo Docío, Júlia Falcão, José Javier Saiz, Robiert Sepulveda Torres, Jeremy Barnes, Pablo Gamallo 0001, Aitor Gonzalez-Agirre, German Rigau, Marta Villegas. 10491-10519 [doi]

Efficient Architectures for High Resolution Vision-Language ModelsMiguel Carvalho, Bruno Martins. 10520-10530 [doi]

NCRE: A Benchmark for Document-level Nominal Compound Relation ExtractionJincheng Cao, Bobo Li, Jiang Liu, Donghong Ji. 10531-10540 [doi]

Comet: Dialog Context Fusion Mechanism for End-to-End Task-Oriented Dialog with Multi-task LearningHaipeng Sun, Junwei Bao 0001, Youzheng Wu, Xiaodong He 0001. 10541-10553 [doi]

Counterfactual Debating with Preset Stances for Hallucination Elimination of LLMsYi Fang 0008, Moxin Li, Wenjie Wang 0007, Lin Hui, Fuli Feng. 10554-10568 [doi]

Extracting the Essence and Discarding the Dross: Enhancing Code Generation with Contrastive Execution FeedbackXuanyu Zhang, Qing Yang. 10569-10575 [doi]

From Facts to Insights: A Study on the Generation and Evaluation of Analytical Reports for Deciphering Earnings CallsTomas Goldsack, Yang Wang, Chenghua Lin, Chung-Chi Chen 0001. 10576-10593 [doi]

Leveraging LLM-Generated Schema Descriptions for Unanswerable Question Detection in Clinical DataDonghee Han, Seungjae Lim, Daeyoung Roh, SangRyul Kim, Sehyun Kim, Mun Yong Yi. 10594-10601 [doi]

Converging to a Lingua Franca: Evolution of Linguistic Regions and Semantics Alignment in Multilingual Large Language ModelsHongchuan Zeng, Senyu Han, Lu Chen 0002, Kai Yu 0004. 10602-10617 [doi]

Understanding Token Probability Encoding in Output EmbeddingsHakaze Cho, Yoshihiro Sakai, Kenshiro Tanaka, Mariko Kato, Naoya Inoue. 10618-10633 [doi]

Investigating Bias in LLM-Based Bias Detection: Disparities between LLMs and Human PerceptionLuyang Lin, Lingzhi Wang, Jinsong Guo, Kam-Fai Wong. 10634-10649 [doi]

Evaluating the Consistency of LLM EvaluatorsNoah Lee, Jiwoo Hong, James Thorne. 10650-10659 [doi]

MDPO: Customized Direct Preference Optimization with a Metric-based Sampler for Question and Answer GenerationYihang Wang, Bowen Tian, Yueyang Su, Yixing Fan, Jiafeng Guo. 10660-10671 [doi]

A Collaborative Reasoning Framework Powered by Reinforcement Learning and Large Language Models for Complex Questions Answering over Knowledge GraphZhiqiang Zhang, Wen Zhao. 10672-10684 [doi]

Scalability of Bayesian Network Structure Elicitation with Large Language Models: a Novel Methodology and Comparative AnalysisNikolay Babakov, Ehud Reiter, Alberto Bugarín Diz. 10685-10711 [doi]

An LLM-based Framework for Biomedical Terminology Normalization in Social Media via Multi-Agent CollaborationYongqi Fan, Kui Xue, Zelin Li, Xiaofan Zhang, Tong Ruan. 10712-10726 [doi]

Driving Chinese Spelling Correction from a Fine-Grained PerspectiveLinfeng Liu 0003, Hongqiu Wu, Hai Zhao 0001. 10727-10737 [doi]

LAiW: A Chinese Legal Large Language Models BenchmarkYongfu Dai, Duanyu Feng, Jimin Huang, Haochen Jia, Qianqian Xie, Yifang Zhang, Weiguang Han, Wei Tian, Hao Wang. 10738-10766 [doi]

Retrieval-Augmented Generation for Large Language Model based Few-shot Chinese Spell CheckingMing Dong 0004, Zhiwei Cheng, Changyin Luo, Tingting He 0003. 10767-10780 [doi]

GADFA: Generator-Assisted Decision-Focused Approach for Opinion Expressing Timing IdentificationChung-Chi Chen 0001, Hiroya Takamura, Ichiro Kobayashi, Yusuke Miyao, Hsin-Hsi Chen. 10781-10794 [doi]

Beyond Chain-of-Thought: A Survey of Chain-of-X Paradigms for LLMsYu Xia, Rui Wang 0088, Xu Liu, Mingyan Li, Tong Yu 0001, Xiang Chen, Julian J. McAuley, Shuai Li 0010. 10795-10809 [doi]

Interpreting Topic Models in Byte-Pair Encoding SpaceJia Peng Lim, Hady Wirawan Lauw. 10810-10838 [doi]

SUMIE: A Synthetic Benchmark for Incremental Entity SummarizationEunJeong Hwang, Yichao Zhou 0001, Beliz Gunel, James Bradley Wendt, Sandeep Tata. 10839-10864 [doi]

Text-Attributed Graph Learning with Coupled AugmentationsChuang Zhou 0002, Jiahe Du, Huachi Zhou, Hao Chen 0062, Feiran Huang, Xiao Huang 0001. 10865-10876 [doi]

From Chaotic OCR Words to Coherent Document: A Fine-to-Coarse Zoom-Out Network for Complex-Layout Document Image TranslationZhiyang Zhang, Yaping Zhang, Yupu Liang, Lu Xiang, Yang Zhao 0007, Yu Zhou 0001, Chengqing Zong. 10877-10890 [doi]

MESAQA: A Dataset for Multi-Span Contextual and Evidence-Grounded Question AnsweringJui-I Wang, Hen-Hsen Huang, Hsin-Hsi Chen. 10891-10901 [doi]

Beyond Boundaries: Learning a Universal Entity Taxonomy across Datasets and Languages for Open Named Entity RecognitionYuming Yang, Wantong Zhao, Caishuang Huang, Junjie Ye, Xiao Wang, Huiyuan Zheng, Yang Nan, Yuran Wang, Xueying Xu, Kaixin Huang, Yunke Zhang, Tao Gui, Qi Zhang 0001, Xuanjing Huang 0001. 10902-10923 [doi]

Get Confused Cautiously: Textual Sequence Memorization Erasure with Selective Entropy MaximizationZhaohan Zhang, Ziquan Liu, Ioannis Patras. 10924-10939 [doi]

Re-Examine Distantly Supervised NER: A New Benchmark and a Simple ApproachYuepei Li, Kang Zhou 0002, Qiao Qiao, Qing Wang, Qi Li 0012. 10940-10959 [doi]

BinarySelect to Improve Accessibility of Black-Box Attack ResearchShatarupa Ghosh, Jonathan Rusert. 10960-10976 [doi]

Interaction Matters: An Evaluation Framework for Interactive Dialogue Assessment on English Second Language ConversationsRena Gao, Carsten Roever, Jey Han Lau. 10977-11012 [doi]

Imposter: Text and Frequency Guidance for Subject Driven Action Personalization using Diffusion ModelsDivya Kothandaraman, Kuldeep Kulkarni, Sumit Shekhar, Balaji Vasan Srinivasan, Dinesh Manocha. 11013-11028 [doi]

FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning SchemaJunru Lu, Siyu An, Min Zhang, Yulan He 0002, Di Yin, Xing Sun. 11029-11047 [doi]

Context Filtering with Reward Modeling in Question AnsweringSangRyul Kim, James Thorne. 11048-11055 [doi]

Case2Code: Scalable Synthetic Data for Code GenerationYunfan Shao, Linyang Li, Yichuan Ma, Peiji Li, Demin Song, Qinyuan Cheng, Shimin Li, Xiaonan Li, Pengyu Wang, Qipeng Guo, Hang Yan 0001, Xipeng Qiu, Xuanjing Huang 0001, Dahua Lin. 11056-11069 [doi]

Chain-of-Discussion: A Multi-Model Framework for Complex Evidence-Based Question AnsweringMingxu Tao, Dongyan Zhao 0001, Yansong Feng 0002. 11070-11085 [doi]

RAIDEN Benchmark: Evaluating Role-playing Conversational Agents with Measurement-Driven Custom DialoguesBowen Wu, Kaili Sun, Ziwei Bai, Ying Li 0012, Baoxun Wang. 11086-11106 [doi]

CryptOpiQA: A new Opinion and Question Answering dataset on CryptocurrencySougata Sarkar, Aditya Badwal, Amartya Roy, Koustav Rudra, Kripabandhu Ghosh. 11107-11120 [doi]

No Train but Gain: Language Arithmetic for training-free Language Adapters enhancementMateusz Klimaszewski, Piotr Andruszkiewicz, Alexandra Birch. 11121-11134 [doi]

NYAYAANUMANA and INLEGALLLAMA: The Largest Indian Legal Judgment Prediction Dataset and Specialized Language Model for Enhanced Decision AnalysisShubham Kumar Nigam, Balaramamahanthi Deepak Patnaik, Shivam Mishra, Noel Shallum, Kripabandhu Ghosh, Arnab Bhattacharya 0001. 11135-11160 [doi]

ManiTweet: A New Benchmark for Identifying Manipulation of News on Social MediaKung-Hsiang Huang, Hou Pong Chan, Kathleen McKeown, Heng Ji. 11161-11180 [doi]

Filter-then-Generate: Large Language Models with Structure-Text Adapter for Knowledge Graph CompletionBen Liu, Jihai Zhang, Fangquan Lin, Cheng Yang, Min Peng. 11181-11195 [doi]

FineRAG: Fine-grained Retrieval-Augmented Text-to-Image GenerationHuaying Yuan, Ziliang Zhao, Shuting Wang 0002, Shitao Xiao, Minheng Ni, Zheng Liu 0011, Zhicheng Dou. 11196-11205 [doi]

User Willingness-aware Sales Talk DatasetAsahi Hentona, Jun Baba, Shiki Sato, Reina Akama. 11206-11217 [doi]

Return of EM: Entity-driven Answer Set Expansion for QA EvaluationDongryeol Lee, Minwoo Lee 0003, Kyungmin Min, Joonsuk Park, Kyomin Jung. 11218-11234 [doi]

Data Augmentation for Cross-domain Parsing via Lightweight LLM Generation and Tree HybridizationZiyan Zhang, Yang Hou, Chen Gong 0004, Zhenghua Li. 11235-11247 [doi]

CPsyExam: A Chinese Benchmark for Evaluating Psychology using ExaminationsJiahao Zhao, Jingwei Zhu, Minghuan Tan, Min Yang 0007, Renhao Li, Yang Di, Chenhao Zhang 0005, Guancheng Ye, Chengming Li, Xiping Hu 0001, Derek F. Wong. 11248-11260 [doi]

Optimizing Lifelong Fine-Tuning for Multiple Tasks via Dataless Distribution ReplayZhenxing Wang. 11261-11273 [doi]

Physics Reasoner: Knowledge-Augmented Reasoning for Solving Physics Problems with Large Language ModelsXinyu Pang, Ruixin Hong, Zhanke Zhou, Fangrui Lv, Xinwei Yang, Zhilong Liang, Bo Han 0003, Changshui Zhang. 11274-11289 [doi]

Efficient Data Labeling by Hierarchical Crowdsourcing with Large Language ModelsHaodi Zhang, Junyu Yang, Jinyin Nie, Peirou Liang, Kaishun Wu, Defu Lian, Rui Mao 0001, Yuanfeng Song. 11290-11303 [doi]

Can Model Uncertainty Function as a Proxy for Multiple-Choice Question Item Difficulty?Leonidas Zotos, Hedderik van Rijn, Malvina Nissim. 11304-11316 [doi]

RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented GenerationShuting Wang 0002, Xin Yu, Mang Wang, Weipeng Chen, Yutao Zhu 0001, Zhicheng Dou. 11317-11333 [doi]

LlmLink: Dual LLMs for Dynamic Entity Linking on Long Narratives with Collaborative Memorisation and Prompt OptimisationLixing Zhu, Jun Wang 0121, Yulan He 0001. 11334-11347 [doi]

PERSONA: A Reproducible Testbed for Pluralistic AlignmentLouis Castricato, Nathan Lile, Rafael Rafailov, Jan-Philipp Fränken, Chelsea Finn. 11348-11368 [doi]

LuxEmbedder: A Cross-Lingual Approach to Enhanced Luxembourgish Sentence EmbeddingsFred Philippy, Siwen Guo, Jacques Klein, Tegawendé F. Bissyandé. 11369-11379 [doi]

Human Interest Framing across Cultures: A Case Study on Climate ChangeGisela Vallejo, Christine de Kock, Timothy Baldwin, Lea Frermann. 11380-11398 [doi]

OpenFactCheck: Building, Benchmarking Customized Fact-Checking Systems and Evaluating the Factuality of Claims and LLMsYuxia Wang, Minghan Wang, Hasan Iqbal, Georgi N. Georgiev, Jiahui Geng, Iryna Gurevych, Preslav Nakov. 11399-11421 [doi]

A Dataset for Expert Reviewer Recommendation with Large Language Models as Zero-shot RankersVanja M. Karan, Stephen McQuistin, Ryo Yanagida, Colin Perkins, Gareth Tyson, Ignacio Castro, Patrick G. T. Healey, Matthew Purver. 11422-11427 [doi]

Evaluating Model Alignment with Human Perception: A Study on Shitsukan in LLMs and LVLMsDaiki Shiono, Ana Brassard, Yukiko Ishizuki, Jun Suzuki 0001. 11428-11444 [doi]

External Links

Cite Key

Statistics

PDF

Researchr

Proceedings of the 31st International Conference on Computational Linguistics, COLING 2025, Abu Dhabi, UAE, January 19-24, 2025

Abstract

Table of Contents