学术出版物
记录我与AI同行的学术旅程 Tracing my academic journey alongside AI Trazando mi camino académico junto a la inteligencia artificial
代表性论文 Highlighted works Trabajos destacados
Enhanced Privacy and Efficiency in Machine Learning Through Innovative Paradigms
core.ac.uk
围绕隐私强化的机器学习范式,提出跨域协作与效率提升的新框架,为后续联邦学习研究奠定方法论基础。 Synthesizes privacy-enhancing paradigms that enable cross-domain collaboration while boosting training efficiency, forming the methodological bedrock for later federated learning studies. Sintetiza paradigmas que mejoran la privacidad y permiten colaboración entre dominios a la vez que incrementan la eficiencia del entrenamiento, sentando la base metodológica para investigaciones posteriores en aprendizaje federado.
Sentinel-Guided Zero-Shot Learning: A Collaborative Paradigm without Real Data Exposure
IEEE Transactions on Circuits and Systems for Video Technology · 2024
引入“哨兵”协同体,在不暴露原始数据的前提下实现可靠的零样本识别,平衡隐私与泛化性能。 Introduces sentinel agents that coordinate zero-shot learning without revealing raw data, striking a balance between privacy safeguards and generalization quality. Introduce agentes centinela que coordinan el aprendizaje zero-shot sin exponer datos crudos, equilibrando la protección de la privacidad con la capacidad de generalización.
AdaGA-NeRF for Sparse-View Synthesis
IEEE Transactions on Multimedia · 2025
提出自适应高斯混合增强的 NeRF,在稀疏视角下保持几何一致性,显著提升重建质量。 Introduces an adaptive Gaussian aggregation module for NeRF that preserves geometric consistency under sparse views, delivering higher-fidelity reconstructions. Introduce un módulo de agregación gaussiana adaptable para NeRF que mantiene la consistencia geométrica con vistas escasas, logrando reconstrucciones de mayor fidelidad.
Asynchronous Personalized Federated Learning through Global Memorization
Knowledge-Based Systems · 2025
构建全局记忆模块,应对异步设备和个性化需求的双重挑战,显著减轻概念漂移。 Builds a global memorization module that mitigates concept drift when devices join asynchronously, delivering stronger personalization under real-world latency. Propone un módulo de memoria global que reduce la deriva de concepto cuando los dispositivos participan de forma asíncrona, ofreciendo mejor personalización bajo latencia real.
Community-Aware Federated Video Summarization
IEEE International Joint Conference on Neural Networks (IJCNN) · 2023
面向跨组织视频数据构建社区感知的联邦摘要模型,实现隐私友好的多场景剪辑。 Designs a community-aware federated summarizer that learns from video silos without sharing raw footage, enabling privacy-aware highlight creation. Diseña un resumidor federado consciente de la comunidad que aprende de silos de video sin compartir material crudo, generando resúmenes respetuosos con la privacidad.
Privacy-Enhanced Zero-Shot Learning via Data-Free Knowledge Transfer
IEEE International Conference on Multimedia and Expo (ICME) · 2023
构建数据自由的知识蒸馏流程,打破零样本学习对真实样本的依赖。 Delivers a data-free distillation routine that removes the need for raw samples in zero-shot transfer, maintaining accuracy under strict privacy. Propone una destilación sin datos que elimina la necesidad de muestras reales en transferencia zero-shot, manteniendo la precisión bajo fuertes requisitos de privacidad.
Sid-NeRF: Few-Shot NeRF Based on Scene Information Distribution
IEEE International Conference on Multimedia and Expo (ICME) · 2024
通过场景信息分布自适应调度射线采样,将少样本 NeRF 推向真实场景应用。 Leverages scene information distribution to adapt sampling for few-shot NeRF, moving sparse capture toward practical deployment. Aprovecha la distribución de información de la escena para adaptar el muestreo en NeRF de pocas muestras, acercándolo a despliegues prácticos.
A2d2c: Adaptive Attention-Driven Dynamic Convolution
Pattern Recognition · 2025
融合注意力与动态卷积,统一长短程特征建模,实现图像识别的高效泛化。 Bridges attention and dynamic convolution to unify long- and short-range feature modeling, achieving efficient generalization for recognition. Integra atención y convolución dinámica para unificar el modelado de dependencias largas y cortas, logrando generalización eficiente para reconocimiento.
Dynamic Convolution and Graph-Coupled Attention for Cross-Subject EEG-Vision Decoding
British Machine Vision Conference (BMVC)
结合动态图卷积与图注意力,实现跨受试者的 EEG-视觉语义解码,提升脑机接口可迁移性。 Combines adaptive dynamic convolution with graph-coupled attention to decode visual semantics across EEG subjects, improving BCI transferability. Combina convolución dinámica adaptable con atención acoplada a grafos para decodificar semántica visual entre sujetos EEG, mejorando la transferibilidad BCI.
更多出版物 More publications Más publicaciones
D2Fusion: Dual-Domain Fusion with Feature Superposition for Deepfake Detection
Information Fusion · 2025
构建时域与频域联合的深度伪造检测框架,提升跨数据集的鲁棒性。 Presents a time- and frequency-domain fusion pipeline for deepfake forensics, yielding robust performance across datasets. Propone una canalización de fusión en dominios temporal y frecuencial para la forénsica de deepfakes, ofreciendo robustez entre conjuntos de datos.
FMDConv: Fast Multi-Attention Dynamic Convolution via Speed-Accuracy Trade-off
Knowledge-Based Systems · 2025
提出多重注意力驱动的动态卷积,按需裁剪通道开销,实现速度与精度的平衡。 Introduces a multi-attention dynamic convolution that prunes channel cost on demand, balancing throughput and accuracy. Introduce una convolución dinámica con multi-atención que recorta el costo de canales según demanda, equilibrando rendimiento y precisión.
CTNeRF: Cross-Time Transformer for Dynamic Neural Radiance Field from Monocular Video
Pattern Recognition · 2024
引入跨时间 Transformer,将单目视频重建为动态辐射场,支持运动场景的高保真渲染。 Employs a cross-time transformer to reconstruct dynamic radiance fields from monocular video, enabling high-fidelity motion rendering. Emplea un transformer cruzado en el tiempo para reconstruir campos de radiancia dinámicos a partir de video monocular, logrando renderizado de alto detalle.
ConRF: Zero-shot Stylization of 3D Scenes with Conditioned Radiation Fields
Pattern Recognition (PR) (Under Review)
利用条件辐射场实现零样本三维场景风格化,兼顾几何与风格的保真度。 Applies conditioned radiance fields for zero-shot 3D scene stylization, balancing geometric fidelity with artistic control. Aplica campos de radiancia condicionados para estilizar escenas 3D en modo zero-shot, equilibrando fidelidad geométrica y control artístico.
DS-Depth: Dynamic and Static Depth Estimation via a Fusion Cost Volume
IEEE Transactions on Circuits and Systems for Video Technology · 2024
融合动态与静态线索构建代价体,实现复杂场景下的精准深度估计。 Fuses dynamic and static cues inside a cost volume to deliver accurate depth estimation in complex scenes. Fusiona pistas dinámicas y estáticas en un volumen de costo para obtener estimación de profundidad precisa en escenas complejas.
Absolute Zero-Shot Learning
arXiv:2202.11319
探索无样本的知识转移框架,为联邦与隐私场景的零样本学习奠定理论基础。 Explores a data-free transfer framework that grounds zero-shot learning under federated and privacy-aware constraints. Explora un marco de transferencia sin datos que fundamenta el aprendizaje zero-shot en escenarios federados y sensibles a la privacidad.
Semi-Supervised Crowd Counting from Unlabeled Data
arXiv:2108.13969
结合伪标签与密度约束,从海量未标注场景中学习鲁棒的人群计数模型。 Blends pseudo-labeling with density constraints to learn robust crowd counting from largely unlabeled scenes. Combina pseudoetiquetas y restricciones de densidad para aprender conteo de multitudes robusto a partir de escenas mayormente sin etiquetar.